PANews는 2월 6일 Sina Technology에 따르면, Fei-Fei Li와 스탠포드 대학과 워싱턴 대학의 다른 연구자들이 클라우드 컴퓨팅 수수료 50달러 미만으로 s1이라는 인공지능 추론 모델을 훈련했다고 보도했습니다. 이 모델의 수학 및 코딩 능력 테스트에서의 성과는 OpenAl의 o1과 Depsek의 R1과 같은 최첨단 추론 모델과 유사했으며, 이는 널리 주목을 받았습니다. 그러나 s1 모델은 곧 "처음부터 학습된 것이 아니며" 기본 모델은 "Ali Tongyi Qianwen(Qwen) 모델"이라는 점이 지적되었습니다. 이와 관련하여 기자는 알리바바 클라우드에 확인을 요청했습니다. 알리바바 클라우드는 이 소식을 확인하고 다음과 같이 답했습니다. "그들은 Alitong YiQianwen Qwen2.5-32B-Instruct 오픈소스 모델을 기반으로 26분 동안 16개의 H100 GPU에서 감독 미세 조정을 수행하여 새로운 모델 s1-32B를 학습시켰는데, 이는 OpenAI의 o1 및 DeepSeek의 R1과 같은 최첨단 추론 모델의 수학적 및 코딩 기능과 동일한 결과를 달성했으며, 경쟁 수학 문제에서 o1-preview보다 27% 더 높은 성과를 보였습니다."
알리바바 클라우드, 페이페이 리 팀의 S1 모델이 Qwen 훈련 기반임을 확인
댓글
추천 읽어보기
- 2025-05-12
주간 시장 핫스팟 리뷰: MOVE 붕괴와 Web3 조작의 암류, AI와 PayFi가 가속화 기간을 예고
- 2025-05-12
Virtuals가 선두를 달리고 CreatorBid가 숨어 있습니다. AI Agent 트랙의 최신 개발 사항을 살펴보세요.
- 2025-05-12
'상호 관세 전쟁' 3단계 돌입, 암호화폐 전반 반등세, BTC는 이전 고점(05.05~05.11) 빠르게 돌파할 듯
- 2025-05-12
신원 확인부터 자산 확인까지: Sign은 디지털 사회의 새로운 인프라를 선도합니다.
- 2025-05-12
암호화폐 시장은 소폭 하락했고, BTC는 좁은 범위 내에서 변동했으며, AI 부문은 상대적으로 강세를 유지했습니다.
- 2025-05-12
머스크: 그록 3.5는 "아직 너무 거칠고" 약 1주일 정도 다듬어야 할 것 같다.