OpenAI Meluncurkan Gpt-oss-120b dan Gpt-oss-20b, Hadirkan Model Tercanggih ke Perangkat Lokal
Singkatnya OpenAI telah merilis dua model bobot terbuka yang kuat, gpt-oss-120b dan gpt-oss-20b, yang memungkinkan kinerja AI lokal tingkat lanjut tanpa akses internet, menandai langkah besar dalam aksesibilitas pengembang.
Organisasi penelitian kecerdasan buatan OpenAI mengumumkan peluncuran dua model bahasa open-weight canggih bernama gpt-oss-120b dan gpt-oss-20b. Model-model ini menawarkan kinerja yang kuat dalam aplikasi praktis dengan biaya operasional yang rendah. Dirilis di bawah lisensi Apache 2.0 yang fleksibel, model-model ini melampaui model terbuka lain dengan ukuran serupa dalam tugas penalaran, menunjukkan kemampuan penggunaan alat yang tangguh, dan dioptimalkan untuk pengoperasian yang efisien pada perangkat keras kelas konsumen. Proses pelatihan melibatkan teknik pembelajaran penguatan yang dikombinasikan dengan wawasan yang diperoleh dari OpenAIModel internal tercanggih, termasuk o3 dan sistem mutakhir lainnya.
Model gpt-oss-120b berkinerja hampir setara dengan OpenAIModel o4-mini pada tolok ukur penalaran fundamental dan berjalan efisien pada satu GPU 80 GB. Sementara itu, model gpt-oss-20b mencapai hasil yang sebanding dengan OpenAIo3-mini pada benchmark umum dan mampu beroperasi pada perangkat edge dengan memori hanya 16 GB, sehingga cocok untuk aplikasi on-device, inferensi lokal, atau pengujian cepat tanpa memerlukan infrastruktur yang mahal. Kedua model menunjukkan kemampuan yang kuat dalam penggunaan alat, pemanggilan fungsi few-shot, penalaran chain-of-thought (CoT) seperti yang ditunjukkan dalam evaluasi agen Tau-Bench, dan HealthBench, terkadang mengungguli model proprietary seperti OpenAI o1 dan GPT-4o.
Model-model ini kompatibel dengan Responses API dan dirancang untuk terintegrasi dalam alur kerja agensi, menawarkan kepatuhan instruksi tingkat lanjut, penggunaan alat termasuk pencarian web dan eksekusi kode Python, serta kemampuan penalaran. Ini mencakup upaya penalaran yang dapat disesuaikan untuk mengoptimalkan tugas-tugas yang tidak memerlukan penalaran kompleks atau yang memprioritaskan latensi rendah dalam keluaran akhir. Kedua model sepenuhnya dapat dikustomisasi, mendukung penalaran rantai pemikiran penuh, dan mengakomodasi format keluaran terstruktur.
Pertimbangan keselamatan menjadi inti dari peluncuran model-model ini, terutama mengingat sifatnya yang terbuka. Selain pelatihan dan evaluasi keselamatan yang komprehensif, lapisan pengujian tambahan diterapkan melalui versi gpt-oss-120b yang telah disempurnakan secara adversarial di bawah OpenAIKerangka Kesiapsiagaan. Model gpt-oss mencapai kinerja tolok ukur keselamatan yang sebanding dengan OpenAIModel-model terbaru milik perusahaan, memberikan jaminan keselamatan serupa kepada para pengembang. Hasil detail dan informasi lebih lanjut tersedia dalam makalah penelitian dan kartu model, dengan metodologi yang ditinjau oleh para ahli eksternal, yang menunjukkan kemajuan dalam menetapkan standar keselamatan baru untuk model bobot terbuka.
OpenAI telah berkolaborasi dengan mitra awal seperti AI Sweden, Orange, dan Snowflake untuk mengeksplorasi penggunaan nyata model-model terbuka ini, termasuk hosting lokal untuk keamanan data dan penyempurnaan pada set data khusus. Ketersediaan model-model terbuka ini bertujuan untuk memberdayakan beragam pengguna—mulai dari pengembang individu hingga perusahaan besar dan lembaga pemerintah—untuk menjalankan dan menyesuaikan AI pada infrastruktur mereka sendiri. Ketika dikombinasikan dengan model lain yang dapat diakses melalui OpenAIAPI, pengembang dapat memilih dari berbagai opsi yang menyeimbangkan kinerja, biaya, dan latensi untuk mendukung alur kerja AI yang beragam.
Gpt-oss-120b dan Gpt-oss-20b Kini Tersedia Gratis dengan Dukungan Platform dan Perangkat Keras yang Luas
Bobot untuk gpt-oss-120b dan gpt-oss-20b dapat diunduh secara terbuka di Hugging Face dan dilengkapi dengan kuantisasi asli dalam format MXFP4. Hal ini memungkinkan model gpt-oss-120b beroperasi dalam kapasitas memori 80GB, sementara model gpt-oss-20b hanya membutuhkan 16GB. Kedua model telah menjalani pasca-pelatihan menggunakan format prompt harmoni, dan perender harmoni sumber terbuka tersedia dalam Python dan Rust untuk memfasilitasi adopsi. Selain itu, implementasi referensi disediakan untuk menjalankan inferensi menggunakan PyTorch dan platform Metal Apple, beserta serangkaian alat contoh untuk aplikasi praktis.
Model-model ini dirancang untuk fleksibilitas dan kemudahan penggunaan, mendukung penerapan secara lokal, di perangkat, atau melalui penyedia inferensi pihak ketiga. Untuk meningkatkan aksesibilitas, kemitraan telah terjalin sebelum peluncuran dengan platform penerapan utama termasuk Azure, Hugging Face, vLLM, Ollama, llama.cpp, LM Studio, AWS, Fireworks, Together AI, Baseten, Databricks, Vercel, Cloudflare, dan OpenRouter. Kolaborasi dengan produsen perangkat keras seperti NVIDIA, AMD, Cerebras, dan Groq juga dilakukan untuk memastikan kinerja optimal di berbagai sistem.
Bersamaan dengan rilis ini, Microsoft menghadirkan versi model gpt-oss-20b yang dioptimalkan untuk GPU untuk perangkat Windows. Didukung oleh ONNX Runtime, versi ini mendukung inferensi lokal dan dapat diakses melalui Foundry Local dan AI Toolkit untuk VS Code, yang menyederhanakan proses integrasi bagi para pengembang di platform Windows.
Bagi pengembang yang mencari model yang sepenuhnya dapat dikustomisasi dan dapat disetel dengan baik serta diterapkan di lingkungan mereka sendiri, model gpt-oss menyediakan solusi yang tepat. Sebaliknya, bagi mereka yang membutuhkan kapabilitas multimoda, alat bawaan, dan integrasi platform yang lancar, model yang ditawarkan melalui platform API tetap menjadi pilihan utama. Umpan balik dari pengembang terus dipantau, dengan potensi pertimbangan untuk dukungan API model gpt-oss di masa mendatang.
Pengenalan gpt-oss-120b dan gpt-oss-20b merupakan kemajuan penting dalam bidang model bobot terbuka, yang memberikan peningkatan signifikan dalam kemampuan penalaran dan keamanan pada skalanya. Model terbuka ini melengkapi model host proprietary dengan menawarkan pilihan alat yang lebih luas kepada pengembang untuk memfasilitasi penelitian mutakhir, merangsang inovasi, dan mendorong pengembangan AI yang lebih aman dan transparan di berbagai aplikasi.
Lebih lanjut, model-model terbuka ini membantu mengurangi hambatan masuk bagi pasar negara berkembang, sektor-sektor dengan sumber daya terbatas, dan organisasi-organisasi kecil yang mungkin menghadapi kendala dalam mengadopsi solusi kepemilikan. Dengan menyediakan perangkat yang mudah diakses dan canggih, pengguna di seluruh dunia diberdayakan untuk mengembangkan, berinovasi, dan menciptakan peluang-peluang baru. Ketersediaan luas model-model berbobot terbuka yang mumpuni ini, yang diproduksi di Amerika Serikat, berkontribusi pada perluasan akses AI yang merata.
Ekosistem model terbuka yang andal merupakan komponen penting dalam mendorong aksesibilitas AI yang luas dan inklusif. Para pengembang dan peneliti didorong untuk memanfaatkan model-model ini untuk eksperimen, kolaborasi, dan mendorong batasan-batasan yang dapat dicapai. Kemajuan yang berkelanjutan di bidang ini sangat dinantikan.
Disclaimer: Konten pada artikel ini hanya merefleksikan opini penulis dan tidak mewakili platform ini dengan kapasitas apa pun. Artikel ini tidak dimaksudkan sebagai referensi untuk membuat keputusan investasi.
Kamu mungkin juga menyukai
Bitget merilis Laporan Valuasi Dana Perlindungan Bulan Juli 2025
Pasangan perdagangan margin spot baru - TOWNS/USDT
[Listing Perdana] Bitget Akan Listing GHO (GHO) di Zona Inovasi
CandyBomb x TOWNS: Trading futures untuk berbagi 675,000 TOWNS!
Berita trending
LainnyaHarga kripto
Lainnya








