
小米MiMo-V2-Pro:重新定义智能体基础模型的边界
2026年3月18日,小米正式发布了其旗舰基础模型MiMo-V2-Pro,这是一款专为真实世界智能体工作负载而构建的模型。作为智能体系统的“大脑”,MiMo-V2-Pro能够编排复杂工作流、驱动生产工程任务,并可靠地交付结果。它的发布标志着智能体基础模型进入了一个新的发展阶段,将前沿智能体的行动空间从编码扩展到了更广泛的物理世界应用场景。
一、模型核心能力:从对话到任务完成
万亿参数高效架构:MiMo-V2-Pro总参数超过1万亿,其中活跃参数为420亿,约为MiMo-V2-Flash的3倍。它继承了前代的混合注意力机制,并将混合比从5:1提升至7:1,在显著扩展规模的同时保持了高推理效率。模型支持高达100万token的上下文窗口,轻量级多token预测层实现了快速生成。
从聊天到智能体的进化:通过跨更广泛智能体任务的后训练扩展,MiMo-V2-Pro不再仅仅是回答问题或生成精美演示。它被构建为完成任务,目标是深度集成到生产力场景中,成为持续交付真实世界影响的系统和工作流背后的“大脑”。
二、智能体应用表现:全球顶尖水平
MiMo-V2-Pro在多个主流智能体基准测试中表现出色,其智能体能力已进入全球第一梯队。
通用智能体性能:在ClawEval基准测试中,MiMo-V2-Pro得分61.5,全球排名第三,接近Claude Opus 4.6的66.3分,远超Gemini 3 Pro的51.9和GPT-5.2的50.0。在PinchBench平均分上,MiMo-V2-Pro获得81.0分,同样位列全球第三,仅次于Claude Opus 4.6和MiMo-V2-Omni。
编码能力:在SWE-bench Verified测试中,MiMo-V2-Pro得分71.7,超越了Claude Sonnet 4.6和GPT-5.2。在SWE-bench Multilingual多语言编码测试中,它以57.1分领先于Gemini 3 Pro和GPT-5.2。在Terminal-Bench 2.0终端操作基准中,获得86.7分,展示了强大的命令执行能力。在DeepSearch QA-F1搜索问答测试中,得分78.0,表现优于Gemini 3 Pro和GPT-5.2。
工具使用与智能体搜索:在General Agent Tool Use评估中,MiMo-V2-Pro得分61.5,全球第三。在τ2-bench (Telecom)电信领域智能体基准中,得分96.8,展现了在专业领域的强大应用潜力。
三、实际应用场景:从编码到前端开发
编码能力持续进化:在小米内部工程师的深度评估中,MiMo-V2-Pro的编码体验已接近Claude Opus 4.6,展现出更强的系统设计和任务规划能力、更优雅的代码风格以及更高效的问题解决路径。在Hunter Alpha测试阶段,调用量最高的应用全部是编码工具,这证实了MiMo-V2-Pro在真实开发工作流中的高可用性和可靠性。
智能体前端开发:在前端场景中,MiMo-V2-Pro展现出强大的端到端完成能力。在OpenClaw框架内,它能通过单个查询生成精美、功能完整的网页,在视觉质量与实用可用性之间取得平衡。例如,它能模仿1990年代印刷杂志美学,生成具有多栏网格、印刷出血效果、复古滤镜和纸质纹理的复杂页面;也能使用Three.js或Babylon.js构建3D塔防游戏,支持多种塔类型、敌人变体、动态攻击效果和关卡模式。
四、OpenClaw原生大脑:开源社区的核心引擎
MiMo-V2-Pro是OpenClaw通用智能体框架的原生大脑。OpenClaw是一个在开源社区中获得显著关注度的通用智能体框架,而MiMo-V2-Pro通过SFT和RL在复杂、多样的智能体脚手架上进行微调,具备了更强的工具调用和多步推理能力。在OpenClaw标准评估基准PinchBench和ClawEval上,MiMo-V2-Pro取得了全球领先的结果。凭借其100万token的上下文窗口,它能够轻松支持高强度、真实世界的Claw应用流程。
五、实际部署与社区验证
在正式发布前一周,代号Hunter Alpha的匿名模型在OpenRouter平台上线测试。在其上线期间,调用量稳步增长,连续多日登顶每日调用量榜首,总使用量超过1万亿token。Hunter Alpha正是MiMo-V2-Pro的早期内部测试版本。经过一周的持续迭代和优化,正式版MiMo-V2-Pro在长上下文能力和智能体场景稳定性方面实现了显著提升。
社区反馈一致表明,在早期版本测试中(非最终性能),MiMo-V2-Pro在大多数场景中表现优于Claude 4.6 Sonnet,进一步验证了其在实际应用中的卓越表现。
六、开放API与定价策略
MiMo-V2-Pro API现已公开发布,支持100万token上下文,并采用基于使用量的分层定价:对于256K上下文以内,输入价格为每百万token 1美元,输出3美元;对于256K至1M上下文,输入价格为2美元,输出6美元。缓存读取价格仅为0.20美元,缓存写入当前免费。这一价格策略相比Claude Sonnet 4.6和Opus 4.6具有显著的性价比优势。
七、未来方向
MiMo-V2-Pro是小米迈向AGI道路上的一个重要里程碑。小米MiMo团队将保持高速的研究和工程迭代节奏,持续交付整体体验不断优化的智能体基础模型。未来的核心方向是攻克高复杂度推理和长周期任务规划,系统性地提升模型在未知环境中的泛化能力和决策能力,向着真正的通用智能迈进。
MiMo-V2-Pro正在与包括OpenClaw、OpenCode、KiloCode、Blackbox和Cline在内的五大智能体开发框架合作,为全球开发者提供一周的免费API访问,加速智能体应用的创新与落地。
相关导航

MeiliSearch
promptvine
gptgo
Cherry Studio
WisPaper-免费AI学术搜索


