小米MiMo-V2.5全鏈路語音大模型發(fā)布，TTS與ASR能力升級加速AI應用落地-移動互聯(lián)-虎科技

小米MiMo-V2.5全鏈路語音大模型發(fā)布，TTS與ASR能力升級加速AI應用落地

時間：2026-04-26 18:24 來源：快訊作者：江紫萱

小米近日正式推出MiMo-V2.5全鏈路語音大模型系列，涵蓋三款TTS語音合成模型與一款ASR語音識別模型，標志著其在智能語音交互領域完成從“精準識別”到“自然表達”的技術閉環(huán)。目前，TTS系列模型已在MiMo Studio平臺開放限時免費體驗，ASR模型代碼與權重則面向全球開發(fā)者開源。

作為核心突破的TTS系列聚焦“導演級”語音控制能力，用戶可通過自然語言指令靈活調(diào)節(jié)語速、情緒與語氣。其中，VoiceDesign功能支持“一句話生成定制音色”，而VoiceClone技術僅需30秒音頻樣本即可實現(xiàn)人聲高保真復刻。配套的MiMo-V2.5-ASR模型則展現(xiàn)多維度技術優(yōu)勢：不僅支持吳語、粵語等中文方言及中英混合識別，還能在80分貝以上噪音環(huán)境中保持97%的準確率，并直接輸出帶標點符號的文本結果。

該技術組合對AI應用生態(tài)產(chǎn)生顯著推動作用。TTS模型的開放策略與ASR的開源模式形成互補，開發(fā)者可基于小米提供的全棧工具鏈，以極低成本構建具備擬人化交互能力的智能體。據(jù)測試，使用該系列模型開發(fā)的智能客服、有聲讀物生成等場景，用戶滿意度較傳統(tǒng)方案提升40%以上。

技術文檔顯示，MiMo-V2.5系列采用分層架構設計，TTS模型通過動態(tài)聲學建模實現(xiàn)毫秒級響應，ASR模型則運用多模態(tài)預訓練框架提升復雜場景適應性。小米AI實驗室負責人表示，此次開源的ASR模型已通過ISO/IEC 30145安全認證，開發(fā)者可直接部署于醫(yī)療、金融等對數(shù)據(jù)隱私要求嚴苛的領域。

更多>同類內(nèi)容

互聯(lián)網(wǎng)裁員浪潮中，掌握項目管理技能為何成	“綠道+”引擎驅(qū)動滇池文旅新篇：品質(zhì)升級
AI應用市場格局生變：頭部大廠穩(wěn)占優(yōu)勢創(chuàng)	Unity中國推出AI OS 3D空間智能座艙，開啟

国产国产乱老视频网站97|高中少女桑桑的日常小说|欧美高清v doso|男生和女生一起生孩子短视频|含精入睡的青梅HH|欲望都市游戏|夫妻主找奴

小米MiMo-V2.5全鏈路語音大模型發(fā)布，TTS與ASR能力升級加速AI應用落地