PANews 4月30日消息,根據小米公司公眾號“Xiaomi MiMo”,小米今日開源首個專為“Reasoning(推理)”打造的大模型MiMo-7B,在AIME數學推理和LiveCodeBench編程測評中超越OpenAI o1-mini及阿里Qwen-32B。 MiMo透過大規模推理資料預訓練與強化學習後訓練連動提升推理能力,提出Test Difficulty Driven Reward等創新演算法,並在同類7B模型中強化學習潛力領先。全系列已開源至Hugging Face ,相關技術報告同步發布。