小米MiMo加入價格戰！API價格直降99% 推理優化成降價底氣-業界資訊-虎科技

小米MiMo加入價格戰！API價格直降99% 推理優化成降價底氣

時間：2026-05-27 19:04 來源：快訊作者：唐云澤

國產大模型市場再掀波瀾，小米正式宣布加入API價格戰。繼DeepSeek宣布永久降價后，小米MiMo-V2.5系列API價格同步大幅下調，最高降幅達99%，同時推出新版Token Plan計費體系，取消上下文窗口長度差異化定價策略。

根據最新定價方案，MiMo-V2.5輸入緩存命中價格降至0.02元/百萬tokens，未命中輸入為1元/百萬tokens，輸出價格為2元/百萬tokens；Pro版本對應價格分別為0.025元、3元和6元。值得注意的是，此次調整徹底取消了此前按256K/1M上下文窗口長度區分的價格體系，實現全場景統一計價。這一策略與DeepSeek-V4-Pro的定價模式形成直接對標，后者輸入緩存命中價格已壓至0.01元/百萬tokens。

計費體系改革成為本次調整的核心亮點。小米同步升級Token Plan套餐，在維持原價基礎上將Credits額度提升至原有水平的5-8倍。以MiMo-V2.5為例，39元Lite套餐在95%緩存命中率場景下可支持超5億tokens使用量，659元Max套餐更突破100億tokens。針對Agent與Code類高緩存命中場景，實際可用額度還將進一步提升。為驗證新體系效果，小米披露其"百萬億Token創造者激勵計劃"已提前完成發放，所有有效期內用戶Credits額度于5月27日零時自動重置并切換新規則。

技術層面的突破為價格調整提供支撐。小米團隊通過優化SGLang HiCache架構，將KV Cache在GPU/CPU/SSD多級存儲間的數據搬運量減少至原方案的1/7，可緩存token數量提升5倍。配合專家并行方案優化和輸入長度分桶策略調整，集群輸入吞吐能力顯著增強，單位token成本得以有效控制。這種技術驅動的成本優化路徑，與DeepSeek通過緩存命中策略提升效率的做法形成行業共振。

市場格局正經歷劇烈變動。在OpenRouter全球應用調用榜中，MiMo-V2.5-Pro排名已從月初的榜首滑落至第14位，Hermes Agent模型月調用榜更是跌至第16名。當前三甲被DeepSeek-V4-Flash、匿名模型Owl Alpha及DeepSeek-V4-Pro占據，顯示市場競爭進入白熱化階段。與此同時，行業呈現明顯分化態勢：阿里暫停Coding Plan低價套餐，字節下架相關產品，智譜則將2026年一季度API價格上調83%，與小米、DeepSeek的降價策略形成鮮明對比。

小米的激進策略與其財務表現形成微妙關聯。最新財報顯示，公司一季度營收991億元同比下降10.9%，凈利潤61億元同比下滑43.1%，但研發支出同比增長33.4%至90億元，研發人員數量創下26048人的歷史新高。管理層在財報會上強調，AI業務投入將根據發展狀況動態調整，預期投資規模可能進一步擴大。這種"增收不增利"背景下仍堅持技術投入和市場擴張的策略，折射出國產大模型廠商在商業化道路上的艱難抉擇。

更多>同類內容

盧偉冰辟謠小米YU9傳言內部代號“昆侖”新	石頭科技榮膺福布斯DTC跨境影響力品牌，以
愛瑪科技與華為深化合作：以技術賦能攜手，	華策影視否認解散電影部門傳聞內容戰略升

国产国产乱老视频网站97|高中少女桑桑的日常小说|欧美高清v doso|男生和女生一起生孩子短视频|含精入睡的青梅HH|欲望都市游戏|夫妻主找奴

小米MiMo加入價格戰！API價格直降99% 推理優化成降價底氣