国产国产乱老视频网站97|高中少女桑桑的日常小说|欧美高清v doso|男生和女生一起生孩子短视频|含精入睡的青梅HH|欲望都市游戏|夫妻主找奴

  • 虎科技 - 領先的互聯網科技媒體

蘋果發布三項AI研究新成果 持續深耕空間計算與Vision Pro頭顯領域

   時間:2026-05-12 14:40 來源:快訊作者:顧青青

科技媒體近日披露,蘋果公司正通過一系列前沿研究持續深耕空間計算領域,并為其Vision Pro頭顯生態注入新動能。盡管此前有傳聞稱蘋果暫停了新一代Vision Pro的研發,轉而聚焦Siri與AI智能眼鏡項目,但最新公開的三項研究成果表明,這家科技巨頭仍在多維度推進空間計算技術的突破。

在機器學習領域,蘋果研究人員提出了名為SFI-Bench的測試框架,旨在評估多模態大模型對空間功能的理解能力。該框架包含134段室內場景視頻掃描數據,并設計了1555道專家標注問題。與傳統僅測試"物體是什么、在哪里"的評估方式不同,SFI-Bench要求模型完成更復雜的任務:例如從柜子中找出特定品牌數量最多的瓶子組,理解如何取消洗衣機當前程序,或判斷電視遙控器的具體用途。測試結果顯示,Google Gemini 3.1 Pro在綜合評分中領先,OpenAI GPT-5.4-High緊隨其后,但所有模型在"帶條件的全局計數"任務中表現欠佳,空間記憶與功能知識整合能力仍有待提升。

另一項研究聚焦于美國手語(ASL)的自動化標注技術。通過構建近500條人工英文字詞到術語的標注庫,并擴展至超過300小時的ASL STEM Wiki數據和7.5小時的FLEURS-ASL數據集,蘋果開發的手指拼寫模型在FSBoard測試中達到6.7%的字符錯誤率(CER),在ASL Citizen數據集上實現74%的top-1準確率。這項技術有望顯著降低手語視頻標注的人力成本,為聽障群體創造更友好的數字交互環境。

在3D建模領域,蘋果提出的HeadsUp方法引發關注。該技術利用層級建模(LLM)技術,通過多角度圖像采集重建高質量3D頭部模型。測試使用的內部數據集包含超1萬名受試者的面部數據,規模較現有同類數據集擴大一個數量級。這項突破或與Vision Pro的Persona虛擬形象系統及visionOS的人臉捕捉技術密切相關,可能為用戶帶來更自然的表情渲染體驗。

蘋果全球營銷高級副總裁格雷格·喬斯維亞克曾公開表示,Vision Pro代表著數字與物理世界融合的必然趨勢。盡管他拒絕預測"空間計算"成為主流的具體時間表,但強調這一技術方向具有不可逆轉性。隨著三項研究成果的陸續公布,蘋果在空間計算領域的戰略布局正逐步清晰,其技術積累或將為下一代交互設備奠定基礎。

 
 
更多>同類內容
推薦圖文
推薦內容
點擊排行
 
智快科技微信賬號
ITBear微信賬號

微信掃一掃
加微信拉群
電動汽車群
科技數碼群