アリババクラウドは、フェイフェイ・リーのチームのS1モデルがQwenトレーニングに基づいていることを確認した

PA一线｜2025-02-06 22:13

PANewsは2月6日、新浪科技によると、スタンフォード大学とワシントン大学のフェイフェイ・リー氏らの研究者が、クラウドコンピューティング料金50ドル未満で人工知能推論モデル「s1」を訓練したと報じた。このモデルの数学およびコーディング能力テストでの成績は、OpenAlのo1やDepsekのR1など最先端の推論モデルと同等で、広く注目を集めた。しかし、s1 モデルはすぐに「ゼロからトレーニングされたものではない」ことが指摘され、そのベースモデルは「Ali Tongyi Qianwen (Qwen) モデル」でした。これに関して、記者はアリババクラウドに確認を求めた。アリババクラウドはこのニュースを認め、次のように回答した。「アリトン・イーチェンウェンQwen2.5-32B-Instructオープンソースモデルをベースとし、16個のH100 GPUで26分間の微調整を監督し、新しいモデルs1-32Bをトレーニングしたところ、OpenAIのo1やDeepSeekのR1などの最先端の推論モデルの数学的およびコーディング機能と同じ結果を達成し、競技数学問題ではo1-previewよりも27％高いパフォーマンスを発揮しました。」

原文リンク