小米全新推出的Mimo大模型仅7B参数,却凭借独特技术优势在数学推理和代码生成测试中超越了OpenAI o1 - mini和阿里QwQ - 32B - Preview,同时具备能耗低、支持消费级GPU部署等亮点。
MiMo的核心技术在于“算法 - 数据 - 框架”三位一体创新。数据方面,团队从科学论文、竞赛题库等高阶场景挖掘2000亿tokens专项数据,覆盖复杂数学定理证明与跨领域代码迁移任务,并经过三阶段渐进训练,累计处理25万亿tokens。算法层面首创“Test Difficulty Driven Reward”动态调整奖励机制,解决复杂任务奖励稀疏问题,结合“Easy Data Re - Sampling”提升强化学习稳定性40%。框架上,自研“Seamless Rollout”系统将模型迭代效率提升2.29倍,验证速度加快1.96倍,推理延迟压至300毫秒以内,实现消费级硬件实时推理。
性能上,MiMo - 7B在数学推理(AIME 24 - 25)和代码竞赛(LiveCodeBench v5)等权威测评中表现突出,强化学习潜力超越包括DeepSeek - R1 - Distill - 7B和Qwen2.5 - 32B在内的多种知名模型。小米同时搭建万卡GPU集群,引入顶尖人才,加速AI布局,其开源策略也吸引开发者参与生态建设,有望推动行业标准革新。
Mimo凭借小参数实现高能效的技术突破,不仅挑战了传统“参数至上”的行业逻辑,也为端侧AI应用提供了新范式,未来或在大模型隐私性、效率性上引发新一轮变革。