国产国产乱老视频网站97|高中少女桑桑的日常小说|欧美高清v doso|男生和女生一起生孩子短视频|含精入睡的青梅HH|欲望都市游戏|夫妻主找奴

  • 虎科技 - 領先的互聯(lián)網(wǎng)科技媒體

京東JoyAI-Image-Edit圖像模型開源,引領AI圖像編輯進入三維空間重塑新時代

   時間:2026-04-08 03:38 來源:天脈網(wǎng)作者:朱天宇

在AI圖像編輯領域,傳統(tǒng)模型長期面臨空間邏輯混亂的瓶頸——移動物體時出現(xiàn)變形、切換視角時透視錯亂、調(diào)整物體層級時遮擋關系失衡。這些難題源于模型對三維空間結(jié)構(gòu)的理解缺失,導致編輯操作僅停留在像素層面。京東探索研究院近日推出的開源模型JoyAI-Image-Edit,通過構(gòu)建完整的空間智能體系,實現(xiàn)了從平面修圖到三維空間重塑的技術跨越。

該模型創(chuàng)新性地將空間認知能力深度融入圖像生成流程,通過建立相機坐標系變換、物體空間位移旋轉(zhuǎn)、幾何結(jié)構(gòu)精準控制等核心技術模塊,構(gòu)建起覆蓋空間位置關系、多視角一致性、場景推理等維度的完整體系。實驗數(shù)據(jù)顯示,在物體移動精度、空間布局合理性等關鍵指標上,該模型已達到國際領先水平。其突破性在于打破了"生成圖像"與"理解空間"的界限,使AI既能生成逼真視覺效果,又能精準維護場景的幾何規(guī)律與物理合理性。

三大核心編輯范式構(gòu)成技術護城河:視角變換功能支持通過自然語言指令調(diào)整相機參數(shù),在保持場景幾何一致性的前提下生成新視角圖像;空間漫游能力可連續(xù)生成邏輯連貫的多視角序列,實現(xiàn)三維場景中的"虛擬漫游";物體空間關系操控技術能在保持整體結(jié)構(gòu)穩(wěn)定的前提下,對特定物體進行位移、縮放等操作,并自動修正遮擋與光影關系。這些能力與15類通用編輯功能深度融合,覆蓋物體替換、風格遷移、細節(jié)精修等高頻需求,形成全場景創(chuàng)作解決方案。

在具身智能等前沿領域,該模型展現(xiàn)出獨特價值。其空間理解能力為機器人感知環(huán)境提供了關鍵技術支撐,使機械臂操作、自主導航等任務獲得更精準的空間坐標參考。在電商內(nèi)容生產(chǎn)場景中,模型可自動生成多角度商品展示圖;創(chuàng)意設計領域支持三維場景的快速構(gòu)建與修改;智能圖像處理方面能高效完成復雜場景的修復與重構(gòu)。技術團隊透露,模型已實現(xiàn)推理代碼全開源,開發(fā)者可直接調(diào)用核心功能開發(fā)應用。

這項突破是京東AI技術矩陣的重要拼圖。就在上月,該集團剛開源了基礎大模型JoyAI-LLM Flash,通過架構(gòu)創(chuàng)新突破參數(shù)規(guī)模限制;京東云"龍蝦"系列產(chǎn)品上線后,token調(diào)用量周環(huán)比增長達455%;全球最大具身數(shù)據(jù)采集中心的建設也在穩(wěn)步推進。依托實體產(chǎn)業(yè)場景優(yōu)勢,京東正持續(xù)推動AI技術從實驗室走向規(guī)模化應用,構(gòu)建起覆蓋基礎研究、技術開發(fā)、產(chǎn)業(yè)落地的完整生態(tài)。

 
 
更多>同類內(nèi)容
推薦圖文
推薦內(nèi)容
點擊排行
 
智快科技微信賬號
ITBear微信賬號

微信掃一掃
加微信拉群
電動汽車群
科技數(shù)碼群