小米旗下MiMo大模型團隊近日宣布,對V2.5系列模型API實施永久性降價策略,最高降幅達到99%,同時取消上下文窗口長度的差異化定價。此次調整還優化了Token Plan計費體系,在保持價格不變的前提下,用戶可獲得的使用量提升至原有水平的5至8倍。消息發布后,小米集團創始人雷軍通過個人賬號轉發了相關公告。
據小米技術官方微博披露,此次價格調整得益于團隊在推理系統層面的技術突破。通過引入SGLang HiCache架構并完整支持SWA(滑動窗口注意力機制),系統將KV Cache在GPU顯存、CPU內存及SSD之間的數據傳輸量壓縮至優化前的七分之一,同時將可緩存token數量擴大至近5倍。這一改進顯著提升了緩存命中率,使模型推理效率得到質的飛躍。
在降價消息公布前一日,小米集團同步披露了2024年第一季度財務數據。報告顯示,該季度集團實現營收991億元,經調整后凈利潤達61億元。其中智能電動汽車及AI等創新業務貢獻收入199億元,期間新車交付量突破8萬輛。值得關注的是,小米當季研發投入同比增長33.4%至90億元,雷軍在業績說明會上進一步宣布,未來三年將在AI領域投入600億元,預計全年研發投入將突破400億元大關。
技術實力方面,MiMo-V2.5-Pro模型已在國際權威評測平臺Artificial Analysis的榜單中取得突破性成績。該模型在綜合智能指數與Agent指數兩項核心指標上,與全球其他開源模型并列首位,標志著小米在人工智能領域的技術積累獲得國際認可。















