阿里雲確認李飛飛團隊的s1模型是基於Qwen訓練

PA一线｜2025-02-06 22:13

PANews 2月6日消息，根據新浪科技，李飛飛等史丹佛大學和華盛頓大學研究人員以不到50美元的雲端運算費用訓練了一個名叫s1的人工智慧推理模型，該模型在數學和編碼能力測試中的表現與OpenAl的o1和Depsek的R1等尖端推理模型類似，引發廣泛關注。不過很快，該s1模型被指“並非從零開始訓練”，其基座模型為“阿里通義千問(Qwen)模型”。對此，記者向阿里雲方面求證，阿里雲方面確認了這一消息，並回應稱：“他們以阿里通義千問Qwen2.5-32B-Instruct開源模型為底座，在16塊H100GPU上監督微調26分鐘，訓練出新模型s1-32B，取得了與OpenAIAIo1-DeepSeeky的表現出相當1-DeepSeeky的表現模型相當1-3 月的標準模型，甚至在數學模型上的表現相當1-32B，取得了與OpenAI的比賽27%。

原文連結