PANews는 4월 30일 샤오미의 공식 계정 "샤오미 MiMo"에 따르면 샤오미가 오늘 "추론"을 위해 특별히 설계된 첫 번째 대형 모델인 MiMo-7B를 오픈 소스로 공개했으며, AIME 수학적 추론 및 LiveCodeBench 프로그래밍 평가에서 OpenAI o1-mini와 Alibaba Qwen-32B를 능가했다고 보도했습니다. MiMo는 대규모 추론 데이터 사전 학습과 강화 학습 사후 학습을 연결하여 추론 기능을 개선하고, 테스트 난이도 기반 보상과 같은 혁신적인 알고리즘을 제안하며, 유사한 70억 개 모델 중에서 가장 뛰어난 강화 학습 잠재력을 가지고 있습니다. 전체 시리즈는 Hugging Face에 오픈 소스로 공개 되었으며, 관련 기술 보고서도 동시에 공개되었습니다.