Perusahaan teknologi asal Tiongkok, DeepSeek, kembali jadi sorotan berkat kabar terbaru mengenai pengembangan model AI generasi terbaru mereka yang disebut DeepSeek R2. Setelah sukses mencuri perhatian dengan model LLM (Large Language Model) hemat biaya sebelumnya, kini perusahaan ini tampaknya siap mengguncang dunia AI lagi—kali ini dengan dukungan chip buatan dalam negeri, Huawei Ascend 910B.
Rumor mengenai keberadaan DeepSeek R2 pertama kali muncul dari seorang blogger teknologi terkenal di platform X, @deedydas, yang membagikan bocoran informasi mengenai fitur dan spesifikasi utama dari model AI ini. Walau belum dikonfirmasi secara resmi, kabar tersebut sudah viral di komunitas teknologi karena potensi besar yang ditawarkan oleh R2.
🎉 Introducing DeepSeek App!
— DeepSeek (@deepseek_ai) January 15, 2025
💡 Powered by world-class DeepSeek-V3
🆓 FREE to use with seamless interaction
📱 Now officially available on App Store & Google Play & Major Android markets
🔗Download now: https://t.co/DIwqqkbK93
🌟 1/3 pic.twitter.com/QorHk2lEwj
Salah satu hal paling menarik dari DeepSeek R2 adalah penggunaan arsitektur MoE (Mixture of Experts) versi hybrid. Teknologi ini merupakan salah satu pendekatan paling canggih dalam dunia AI, yang memungkinkan model untuk secara dinamis memilih bagian-bagian dari jaringan sarafnya saat memproses data. Hal ini tentu membawa peningkatan efisiensi dan performa dalam skenario pemrosesan AI berskala besar.
Lebih jauh lagi, MoE hybrid yang digunakan di R2 akan dibekali dengan mekanisme gating canggih dan lapisan padat (dense layers). Gabungan ini dirancang untuk menangani beban kerja tinggi dan memaksimalkan efisiensi pemrosesan data, menjadikannya pilihan ideal untuk berbagai aplikasi AI tingkat lanjut di perusahaan maupun industri.
Dari sisi kapasitas, DeepSeek R2 diperkirakan akan memiliki sekitar 1,2 triliun parameter, jumlah yang dua kali lipat lebih besar dari model sebelumnya, R1. Dengan kapasitas sebesar itu, model ini akan mampu memberikan performa setara bahkan bisa melebihi model-model AI kelas atas lainnya seperti GPT-4 Turbo dan Gemini 2.0.
Baca ini juga :» AMD Ryzen™ Al 300 Series & AMD Ryzen™ Al Max Series, Performa Terbaik dengan AI
» Garansi Laptop ASUS Kini Menjadi 3 Tahun Internasional
» Kecerdasan Buatan dalam Game: Pengaruh pada Gameplay dan Pengalaman Pengguna
» Sutradara Sekaligus Animator One Piece Kecam Tren AI Ubah Foto Bergaya Ghibli
» Apple Watch Bakal Dilengkapi Kamera untuk Fitur AI Canggih
» CEO Nvidia Akui Keunggulan Huawei di Tengah Tekanan AS
» NVIDIA Catat Penjualan Lebih dari 3 Juta GPU Blackwell Tahun Ini, Targetkan Pendapatan $1 Triliun pada 2027
» WhatsApp Uji Coba Fitur Musik di Status, Kini Mulai Tersedia di Indonesia
Namun, yang paling mengejutkan adalah klaim bahwa DeepSeek R2 bisa menjadi model AI paling hemat biaya di pasaran. Berdasarkan bocoran informasi, penggunaan token input hanya dikenakan biaya sekitar $0,07 per juta token, dan token output sebesar $0,27 per juta token. Jika informasi ini akurat, maka R2 bisa menawarkan efisiensi biaya hingga 97,3% lebih murah dibandingkan ChatGPT-4 untuk penggunaan tingkat perusahaan.
Salah satu aspek paling signifikan dari model ini adalah penggunaan chip Huawei Ascend 910B sebagai mesin utamanya. Ini menunjukkan bahwa DeepSeek tidak hanya berfokus pada efisiensi dan efektivitas model, tapi juga mulai mengandalkan sumber daya dalam negeri untuk membangun ekosistem AI-nya sendiri.
Menurut laporan, R2 telah mampu mencapai tingkat pemanfaatan hingga 82% pada klaster prosesor Ascend 910B, dan proses pelatihannya sebagian besar dilakukan menggunakan chip buatan Huawei tersebut. Bahkan, dari segi daya komputasi, DeepSeek R2 disebut mampu menembus angka 512 PetaFLOPS (floating point operations per second) dalam presisi FP16—angka yang sangat mengesankan untuk model AI skala besar.
Selain berita utama di atas, KotakGame juga punya video menarik yang bisa kamu tonton di bawah ini.