小米MiMo-V2.5全系最高降价99%,中国大模型价格战烧到了推理层
小米MiMo团队5月27日零点生效的调价公告,把旗下MiMo-V2.5系列按量计费的价格砍了最高99%。这不是象征性降价——MiMo-V2.5-Pro的输入价格从未命中缓存时的每百万Token几块钱,直接拉到命中缓存仅0.025元,输出6元;标准版MiMo-V2.5更狠,输入命中缓存0.02元、未命中缓存1元、输出2元每百万Token。V2.1-TTS语音系列继续限时免费。
这次降价的背景是小米团队称持续优化了推理性能,阶段性降本成果直接让利给开发者。从定价策略看,MiMo-V2.5-Pro走的是高端推理路线,对标的是DeepSeek-R1和Qwen的旗舰推理模型,而MiMo-V2.5标准版的定价已经和DeepSeek-V3的0.5元输入价格在同一量级,甚至更低。中国大模型的价格战从2024年的API调用费打到了2026年的推理成本,各家都在用规模摊薄算力开支。
同步生效的还有Token Plan的加量政策。已购买Token Plan的用户,V2.5系列模型的Credits用量可提升5到8倍,等效于同样的钱能跑更多请求。更值得关注的是,所有仍在有效期的Token Plan,已消耗的Credits额度被完全重置,有效期不变。这相当于老用户白拿了一轮新额度,小米在用这种方式锁定存量开发者不流失。
MiMo Orbit激励计划也在同一天收官。这个计划从4月28日上线,目标是发放100万亿Token给参与的开发者,到5月26日下午四点,100T Token已全部发完,比预期提前结束。从时间节点看,激励计划刚好覆盖了V2.5系列模型的发布和调价周期,先用免费Token把开发者拉进来,再用极低的定价留住他们——这是一套组合拳。
小米做MiMo大模型的逻辑和做手机硬件类似:先把量做起来,把开发者生态养起来,再靠后续的企业级服务和硬件绑定变现。MiMo-V2.5系列从4月底发布到现在不到一个月就大幅调价,速度比当年DeepSeek和Qwen的价格战节奏还快。小米手里的筹码是手机、IoT设备和汽车终端的存量用户,如果能把这些终端和MiMo模型打通,推理调用量的增长会比纯做API服务的公司快得多。
对开发者来说,推理成本持续下降是实打实的好处。一位在做AI编程工具的开发者告诉我,MiMo-V2.5-Pro的缓存命中价格比同类模型便宜一个数量级,光是代码补全场景就能把月度API开支砍掉七成。但也有开发者担心,这种价格战最终会压缩小公司的生存空间——大厂烧得起钱,创业公司烧不起。到头来,API定价权还是握在几家手里。
不过价格只是一方面。MiMo-V2.5系列在推理能力上的实际表现,才是开发者选择模型的核心考量。价格再低,如果推理质量不稳定、延迟太高,开发者还是会用回贵一点但靠谱的模型。小米这波降价能不能真正抢到市场份额,还要看接下来几个月的开发者留存率和实际调用量数据。