快手可靈視頻O1模型全量登場：統一多模態(tài)，開啟視頻創(chuàng)作新體驗-移動互聯-虎科技

快手可靈視頻O1模型全量登場：統一多模態(tài)，開啟視頻創(chuàng)作新體驗

時間：2025-12-03 01:19 來源：快訊作者：陸辰風

可靈AI近日通過官方公眾號正式宣布，其自主研發(fā)的全球首款統一多模態(tài)視頻生成模型——可靈視頻O1已面向全體用戶開放使用。這一突破性成果標志著視頻生成領域進入全新階段，通過整合多模態(tài)交互能力，實現了從單一功能到綜合創(chuàng)作的跨越式升級。

據技術白皮書披露，該模型創(chuàng)新性采用生成式架構底座，通過多模態(tài)視覺語言（MVL）交互框架，將圖像生成、視頻創(chuàng)作、文本理解等任務整合至統一輸入界面。用戶無需切換不同功能模塊，僅需在單一對話框中輸入混合指令，即可同步完成主體構建、場景渲染與細節(jié)優(yōu)化。例如輸入"生成一位穿紅色漢服的女子在古風庭院中彈奏古箏的視頻，要求鏡頭從全景推近至特寫"，系統可自動解析多維度要求并生成連貫畫面。

核心技術創(chuàng)新方面，模型引入的思維鏈（Chain-of-thought）技術顯著提升了內容邏輯性。通過模擬人類推理過程，系統能夠理解"雨天打傘"與"地面水漬"的因果關系，或"運動員起跑"與"觀眾反應"的時間順序。官方測試數據顯示，在復雜場景的事件推演任務中，模型準確率較前代提升67%，尤其在多主體交互場景中展現出更強的語義理解能力。

創(chuàng)作界面同步迎來重大升級，新版本支持通過自然語言對話調整畫面參數。用戶可實時修改"主體服飾顏色""背景光影效果"等200余項細節(jié)，系統將自動生成多版本方案供選擇。針對專業(yè)創(chuàng)作者，平臺還開放了鏡頭運動控制、幀率調節(jié)等高級功能，滿足從短視頻創(chuàng)作到影視級制作的不同需求。

在主體一致性控制方面，模型通過三維空間建模技術實現了跨鏡頭穩(wěn)定表現。即使經歷"從遠景到特寫"或"360度環(huán)繞拍攝"等極端視角變化，主體特征仍能保持高度一致。測試案例顯示，在連續(xù)200幀的復雜運鏡中，人物面部特征識別誤差率低于0.3%，衣物褶皺、配飾細節(jié)等微觀元素亦能精準復現。該技術已應用于影視預告片制作、虛擬偶像直播等多個商業(yè)化場景。

更多>同類內容

東風日產N6插混中型轎車上市，限時價9.19萬	第七屆工業(yè)互聯網大賽新興產業(yè)賽落幕共繪
500億豪擲淘寶閃購，阿里凈利下滑，即時零	高鑫零售高層變動：沈輝辭任李衛(wèi)平履新接

国产国产乱老视频网站97|高中少女桑桑的日常小说|欧美高清v doso|男生和女生一起生孩子短视频|含精入睡的青梅HH|欲望都市游戏|夫妻主找奴

快手可靈視頻O1模型全量登場：統一多模態(tài)，開啟視頻創(chuàng)作新體驗