国产国产乱老视频网站97|高中少女桑桑的日常小说|欧美高清v doso|男生和女生一起生孩子短视频|含精入睡的青梅HH|欲望都市游戏|夫妻主找奴

  • 虎科技 - 領先的互聯網科技媒體

小紅書與復旦聯手推出InstanceAssemble:AI繪畫精準構圖新突破

   時間:2025-12-26 19:36 來源:天脈網作者:沈瑾瑜

AI繪畫領域迎來重要突破——小紅書與復旦大學聯合研發的InstanceAssemble技術,成功攻克布局控制生成難題,推動AI繪畫進入精準構圖時代。這項創新成果已被國際頂級學術會議NeurIPS 2025收錄,標志著中國科研團隊在生成式AI領域取得關鍵進展。

傳統AI繪畫主要依賴"文字生成圖像"(Text-to-Image)技術,用戶通過文本描述生成對應畫面。而新一代"布局控制生成"(Layout-to-Image)技術則更進一步,允許用戶通過邊界框、分割掩碼或骨架圖等空間約束條件,精確控制圖像中每個元素的位置與內容。這種技術突破為商業設計、游戲開發等領域帶來革命性變革,但始終面臨布局錯位、語義斷層和計算成本過高等挑戰。

研究團隊提出的"實例組裝注意力"機制,通過解耦物體位置與語義特征,實現了像素級精準控制。該技術基于擴散變換器架構,用戶僅需提供物體邊界框坐標和內容描述,系統即可在指定位置生成符合語義的圖像元素。實驗數據顯示,在包含90萬個實例的密集布局數據集上,新技術在布局對齊精度和語義一致性方面均顯著優于現有方案。

技術落地性是該研究的另一大亮點。研究團隊采用輕量化適配策略,僅需調整約7100萬個參數(相當于原模型3.46%的額外計算量),即可將技術無縫集成到Stable Diffusion3-Medium模型。針對Flux.1模型的適配方案更將參數需求壓縮至0.84%,大幅降低企業應用門檻。這種"即插即用"的設計理念,為AI繪畫技術的商業化推廣開辟了新路徑。

為建立科學的評估體系,團隊同步構建了包含5000張圖像和9萬個實例的"Denselayout"基準測試集,并設計出全新的"Layout Grounding Score"(LGS)評估指標。該指標通過量化布局與生成圖像的匹配程度,為行業提供了客觀的技術對比標準。實驗證明,即使在訓練階段僅接觸稀疏布局(≤10個實例)的情況下,系統在密集場景(≥10個實例)中仍能保持穩定性能,展現出強大的泛化能力。

這項突破性成果不僅解決了AI繪畫領域的核心痛點,更為多模態大模型的發展提供了新思路。隨著技術持續優化,未來在虛擬場景構建、個性化內容生成等領域將展現更廣闊的應用前景。研究團隊表示,將持續完善技術細節,推動AI繪畫從"可用"向"好用"邁進。

 
 
更多>同類內容
推薦圖文
推薦內容
點擊排行
 
智快科技微信賬號
ITBear微信賬號

微信掃一掃
加微信拉群
電動汽車群
科技數碼群