國產大模型市場再掀波瀾,小米正式宣布加入API價格戰。繼DeepSeek宣布永久降價后,小米MiMo-V2.5系列API價格同步大幅下調,最高降幅達99%,同時推出新版Token Plan計費體系,取消上下文窗口長度差異化定價策略。
根據最新定價方案,MiMo-V2.5輸入緩存命中價格降至0.02元/百萬tokens,未命中輸入為1元/百萬tokens,輸出價格為2元/百萬tokens;Pro版本對應價格分別為0.025元、3元和6元。值得注意的是,此次調整徹底取消了此前按256K/1M上下文窗口長度區分的價格體系,實現全場景統一計價。這一策略與DeepSeek-V4-Pro的定價模式形成直接對標,后者輸入緩存命中價格已壓至0.01元/百萬tokens。
計費體系改革成為本次調整的核心亮點。小米同步升級Token Plan套餐,在維持原價基礎上將Credits額度提升至原有水平的5-8倍。以MiMo-V2.5為例,39元Lite套餐在95%緩存命中率場景下可支持超5億tokens使用量,659元Max套餐更突破100億tokens。針對Agent與Code類高緩存命中場景,實際可用額度還將進一步提升。為驗證新體系效果,小米披露其"百萬億Token創造者激勵計劃"已提前完成發放,所有有效期內用戶Credits額度于5月27日零時自動重置并切換新規則。
技術層面的突破為價格調整提供支撐。小米團隊通過優化SGLang HiCache架構,將KV Cache在GPU/CPU/SSD多級存儲間的數據搬運量減少至原方案的1/7,可緩存token數量提升5倍。配合專家并行方案優化和輸入長度分桶策略調整,集群輸入吞吐能力顯著增強,單位token成本得以有效控制。這種技術驅動的成本優化路徑,與DeepSeek通過緩存命中策略提升效率的做法形成行業共振。
市場格局正經歷劇烈變動。在OpenRouter全球應用調用榜中,MiMo-V2.5-Pro排名已從月初的榜首滑落至第14位,Hermes Agent模型月調用榜更是跌至第16名。當前三甲被DeepSeek-V4-Flash、匿名模型Owl Alpha及DeepSeek-V4-Pro占據,顯示市場競爭進入白熱化階段。與此同時,行業呈現明顯分化態勢:阿里暫停Coding Plan低價套餐,字節下架相關產品,智譜則將2026年一季度API價格上調83%,與小米、DeepSeek的降價策略形成鮮明對比。
小米的激進策略與其財務表現形成微妙關聯。最新財報顯示,公司一季度營收991億元同比下降10.9%,凈利潤61億元同比下滑43.1%,但研發支出同比增長33.4%至90億元,研發人員數量創下26048人的歷史新高。管理層在財報會上強調,AI業務投入將根據發展狀況動態調整,預期投資規模可能進一步擴大。這種"增收不增利"背景下仍堅持技術投入和市場擴張的策略,折射出國產大模型廠商在商業化道路上的艱難抉擇。















