アリババがより効率的なQwen3-Next人工知能モデルを発表
Jinse Financeによると、Alibaba傘下のTongyi Qianwenは次世代基盤モデルアーキテクチャ「Qwen3-Next」を発表し、このアーキテクチャに基づく「Qwen3-Next-80B-A3B」シリーズモデルをオープンソース化しました。この構造はQwen3のMoEモデル構造と比較して、以下のコア改良が行われています:ハイブリッドアテンションメカニズム、高スパースMoE構造、一連のトレーニング安定性に優れた最適化、そして推論効率を向上させるマルチトークン予測メカニズムです。Qwen3-Nextのモデル構造に基づき、Alibabaは「Qwen3-Next-80B-A3B-Base」モデルをトレーニングしました。このモデルは800億(80 billions)パラメータを持ちながら、実際にアクティブになるのは30億(3 billions)パラメータのみです。このBaseモデルはQwen3-32Bのデンスモデルと同等かそれ以上の性能を実現しつつ、トレーニングコスト(GPU hours)はQwen3-32Bの10分の1以下、32k以上のコンテキストでの推論スループットはQwen3-32Bの10倍以上となり、極めて高いトレーニングおよび推論コストパフォーマンスを実現しています。
免責事項:本記事の内容はあくまでも筆者の意見を反映したものであり、いかなる立場においても当プラットフォームを代表するものではありません。また、本記事は投資判断の参考となることを目的としたものではありません。
こちらもいかがですか?
本日の恐怖と欲望指数は57に上昇し、レベルは中立から欲望に変わりました。
CleanCore SolutionsはDOGEの保有量を5億枚に拡大
イーロン・マスクが再び37兆ドル規模の国債に警鐘を鳴らす
DTCCが3つの暗号資産ETFにSolana、HBAR、XRPを追加
暗号資産価格
もっと見る








