原创综合 2026-05-28

小米MiMo-V2.5全系最高降价99%，中国大模型价格战烧到了推理层

小米MiMo团队5月27日零点生效的调价公告，把旗下MiMo-V2.5系列按量计费的价格砍了最高99%。这不是象征性降价——MiMo-V2.5-Pro的输入价格从未命中缓存时的每百万Token几块钱，直接拉到命中缓存仅0.025元，输出6元；标准版MiMo-V2.5更狠，输入命中缓存0.02元、未命中缓存1元、输出2元每百万Token。V2.1-TTS语音系列继续限时免费。

这次降价的背景是小米团队称持续优化了推理性能，阶段性降本成果直接让利给开发者。从定价策略看，MiMo-V2.5-Pro走的是高端推理路线，对标的是DeepSeek-R1和Qwen的旗舰推理模型，而MiMo-V2.5标准版的定价已经和DeepSeek-V3的0.5元输入价格在同一量级，甚至更低。中国大模型的价格战从2024年的API调用费打到了2026年的推理成本，各家都在用规模摊薄算力开支。

同步生效的还有Token Plan的加量政策。已购买Token Plan的用户，V2.5系列模型的Credits用量可提升5到8倍，等效于同样的钱能跑更多请求。更值得关注的是，所有仍在有效期的Token Plan，已消耗的Credits额度被完全重置，有效期不变。这相当于老用户白拿了一轮新额度，小米在用这种方式锁定存量开发者不流失。

MiMo Orbit激励计划也在同一天收官。这个计划从4月28日上线，目标是发放100万亿Token给参与的开发者，到5月26日下午四点，100T Token已全部发完，比预期提前结束。从时间节点看，激励计划刚好覆盖了V2.5系列模型的发布和调价周期，先用免费Token把开发者拉进来，再用极低的定价留住他们——这是一套组合拳。

小米做MiMo大模型的逻辑和做手机硬件类似：先把量做起来，把开发者生态养起来，再靠后续的企业级服务和硬件绑定变现。MiMo-V2.5系列从4月底发布到现在不到一个月就大幅调价，速度比当年DeepSeek和Qwen的价格战节奏还快。小米手里的筹码是手机、IoT设备和汽车终端的存量用户，如果能把这些终端和MiMo模型打通，推理调用量的增长会比纯做API服务的公司快得多。

对开发者来说，推理成本持续下降是实打实的好处。一位在做AI编程工具的开发者告诉我，MiMo-V2.5-Pro的缓存命中价格比同类模型便宜一个数量级，光是代码补全场景就能把月度API开支砍掉七成。但也有开发者担心，这种价格战最终会压缩小公司的生存空间——大厂烧得起钱，创业公司烧不起。到头来，API定价权还是握在几家手里。

不过价格只是一方面。MiMo-V2.5系列在推理能力上的实际表现，才是开发者选择模型的核心考量。价格再低，如果推理质量不稳定、延迟太高，开发者还是会用回贵一点但靠谱的模型。小米这波降价能不能真正抢到市场份额，还要看接下来几个月的开发者留存率和实际调用量数据。