PANewsは2月6日、新浪科技によると、スタンフォード大学とワシントン大学のフェイフェイ・リー氏らの研究者が、クラウドコンピューティング料金50ドル未満で人工知能推論モデル「s1」を訓練したと報じた。このモデルの数学およびコーディング能力テストでの成績は、OpenAlのo1やDepsekのR1など最先端の推論モデルと同等で、広く注目を集めた。しかし、s1 モデルはすぐに「ゼロからトレーニングされたものではない」ことが指摘され、そのベース モデルは「Ali Tongyi Qianwen (Qwen) モデル」でした。これに関して、記者はアリババクラウドに確認を求めた。アリババクラウドはこのニュースを認め、次のように回答した。「アリトン・イーチェンウェンQwen2.5-32B-Instructオープンソースモデルをベースとし、16個のH100 GPUで26分間の微調整を監督し、新しいモデルs1-32Bをトレーニングしたところ、OpenAIのo1やDeepSeekのR1などの最先端の推論モデルの数学的およびコーディング機能と同じ結果を達成し、競技数学問題ではo1-previewよりも27%高いパフォーマンスを発揮しました。」
アリババクラウドは、フェイフェイ・リーのチームのS1モデルがQwenトレーニングに基づいていることを確認した
コメント
おすすめ読書
- 2025-05-15
AAVEコミュニティが[TEMP CHECK]ガバナンス投票を通過、ペペが最初のミームコイン担保資産としてAAVEエコシステムに参加する可能性があります
- 2025-05-15
CoreWeaveがOpenAIと40億ドルの追加提携を締結
- 2025-05-15
YZi LabsがグローバルインキュベーションプロジェクトEASY Residencyを立ち上げ、キャシー・ドウを責任者に任命
- 2025-05-15
米国のAIビデオプラットフォームHedraが、a16zが主導する3,200万ドルのシリーズA資金調達を完了
- 2025-05-15
北京大学の才能から暗号通貨マイニング界の大物へ、ブロックチェーンの伝説的人物、ウー・ジハン
- 2025-05-15
Binance Wallet、明日17回目のTGE:Alaya AI(AGT)をリリース