PANewsは2月6日、新浪科技によると、スタンフォード大学とワシントン大学のフェイフェイ・リー氏らの研究者が、クラウドコンピューティング料金50ドル未満で人工知能推論モデル「s1」を訓練したと報じた。このモデルの数学およびコーディング能力テストでの成績は、OpenAlのo1やDepsekのR1など最先端の推論モデルと同等で、広く注目を集めた。しかし、s1 モデルはすぐに「ゼロからトレーニングされたものではない」ことが指摘され、そのベース モデルは「Ali Tongyi Qianwen (Qwen) モデル」でした。これに関して、記者はアリババクラウドに確認を求めた。アリババクラウドはこのニュースを認め、次のように回答した。「アリトン・イーチェンウェンQwen2.5-32B-Instructオープンソースモデルをベースとし、16個のH100 GPUで26分間の微調整を監督し、新しいモデルs1-32Bをトレーニングしたところ、OpenAIのo1やDeepSeekのR1などの最先端の推論モデルの数学的およびコーディング機能と同じ結果を達成し、競技数学問題ではo1-previewよりも27%高いパフォーマンスを発揮しました。」
アリババクラウドは、フェイフェイ・リーのチームのS1モデルがQwenトレーニングに基づいていることを確認した
コメント
おすすめ読書
- 2025-05-10
今週のハイライト:ニューハンプシャー州が米国初のビットコイン州準備法案に署名。市場センチメントが回復、BTCは10万ドルに戻り、ETHは急反発
- 2025-05-09
マッキンゼーのLilliの簡単な分析:エンタープライズAI市場にどのような開発アイデアを提供するのか?
- 2025-05-09
HashKey ExchangeはSOC 1タイプ2とSOC 2タイプ2の二重認証を取得しました
- 2025-05-09
YZi Labsは、Web3、AIなどの分野に焦点を当てた10週間のオフライングローバルインキュベーションプログラム「EASY Residence」を開始しました。
- 2025-05-09
マーリンウィザードv0.3が正式にリリースされ、オンチェーン交換、ステーキング、クロスチェーンの3つのAIインタラクションモジュールが統合されました。
- 2025-05-09
ミーム流行の後に、混乱が起こるのか、それとも再生が起こるのか?