JAKARTA, MENARA62.COM — Hanya beberapa hari setelah perusahaan rintisan AI asal Tiongkok, DeepSeek, meluncurkan model penalaran terbarunya, DeepSeek R1, aplikasi iOS milik perusahaan ini melesat ke posisi teratas di App Store milik Apple, meninggalkan ChatGPT milik OpenAI di posisi kedua.
DeepSeek mengklaim bahwa DeepSeek R1 mengalahkan model AI yang bersaing dalam beberapa tolok ukur utama. Dalam pengujian saya, ia benar-benar unggul, membantu saya mendesain proyek web dalam hitungan menit dan membantu saya meningkatkan kemampuan catur.
Sebelumnya, AI baru ini, sudah diperkirakan akan menyita perhatian penduduk dunia maya. Sekitar dua pekan lalu, perusahaan kecerdasan buatan asal Tiongkok, DeepSeek, meluncurkan model bahasa besar bersumber terbuka yang disebut DeepSeek R1.
Menurut DeepSeek, R1 menang atas LLM (model bahasa besar) populer lainnya seperti OpenAI dalam beberapa tolok ukur penting, dan R1 sangat baik dalam tugas-tugas matematika, pengkodean, dan penalaran.
DeepSeek R1 sebenarnya merupakan penyempurnaan dari DeepSeek R1 Zero, yang merupakan LLM yang dilatih tanpa metode konvensional yang disebut supervised fine-tuning. Hal ini membuatnya sangat mumpuni dalam tugas-tugas tertentu, tetapi seperti yang dikatakan oleh DeepSeek sendiri, Zero memiliki “keterbacaan dan pencampuran bahasa yang buruk.” Masuklah R1, yang memperbaiki masalah ini dengan menggabungkan “pelatihan multi-tahap dan data awal yang dingin” sebelum dilatih dengan pembelajaran penguatan.
Open Source
Di samping bahasa teknis yang rumit (detailnya tersedia secara online jika Anda tertarik), ada beberapa hal penting yang harus diketahui tentang DeepSeek R1. Pertama, ini adalah open source, yang berarti ini bisa diawasi oleh para ahli, yang seharusnya mengurangi kekhawatiran tentang privasi dan keamanan. Kedua, ini gratis untuk digunakan sebagai aplikasi situs, sementara akses API sangat murah ($ 0,14 untuk satu juta token input, dibandingkan dengan $ 7,5 dari OpenAI untuk model penalaran yang paling kuat, o1).
Keunggulan DeepSeek, yang benar-benar mendorong popularitas DeepSeek adalah fakta bahwa DeepSeek bersifat open source, dan juga harganya. DeepSeek gratis untuk digunakan di web dan sebagai aplikasi ponsel cerdas, dan perusahaan ini mengenakan biaya yang jauh lebih murah untuk akses API daripada yang dikenakan oleh OpenAI untuk model AI penalarannya yang paling canggih. Banyak utas di jejaring sosial bermunculan selama akhir pekan dengan contoh-contoh orang yang menjalankan DeepSeek pada perangkat keras yang cukup sederhana atau menggunakannya untuk melakukan tugas-tugas yang kompleks.