PANewsは4月30日、Xiaomiの公式アカウント「Xiaomi MiMo」によると、Xiaomiは本日、「推論」専用に設計された初の大型モデルMiMo-7Bをオープンソース化し、AIME数学的推論とLiveCodeBenchプログラミング評価でOpenAI o1-miniとAlibaba Qwen-32Bを上回ったと報じた。 MiMo は、大規模な推論データの事前トレーニングと強化学習の事後トレーニングをリンクすることで推論機能を向上させ、テスト難易度駆動報酬などの革新的なアルゴリズムを提案し、同様の 7B モデルの中でトップクラスの強化学習の可能性を秘めています。全シリーズはHugging Faceにオープンソース化され、関連する技術レポートも同時に公開されました。