蘋果發布三項AI研究新成果持續深耕空間計算與Vision Pro頭顯領域-生活家電-虎科技

蘋果發布三項AI研究新成果持續深耕空間計算與Vision Pro頭顯領域

時間：2026-05-12 14:40 來源：快訊作者：顧青青

科技媒體近日披露，蘋果公司正通過一系列前沿研究持續深耕空間計算領域，并為其Vision Pro頭顯生態注入新動能。盡管此前有傳聞稱蘋果暫停了新一代Vision Pro的研發，轉而聚焦Siri與AI智能眼鏡項目，但最新公開的三項研究成果表明，這家科技巨頭仍在多維度推進空間計算技術的突破。

在機器學習領域，蘋果研究人員提出了名為SFI-Bench的測試框架，旨在評估多模態大模型對空間功能的理解能力。該框架包含134段室內場景視頻掃描數據，并設計了1555道專家標注問題。與傳統僅測試"物體是什么、在哪里"的評估方式不同，SFI-Bench要求模型完成更復雜的任務：例如從柜子中找出特定品牌數量最多的瓶子組，理解如何取消洗衣機當前程序，或判斷電視遙控器的具體用途。測試結果顯示，Google Gemini 3.1 Pro在綜合評分中領先，OpenAI GPT-5.4-High緊隨其后，但所有模型在"帶條件的全局計數"任務中表現欠佳，空間記憶與功能知識整合能力仍有待提升。

另一項研究聚焦于美國手語（ASL）的自動化標注技術。通過構建近500條人工英文字詞到術語的標注庫，并擴展至超過300小時的ASL STEM Wiki數據和7.5小時的FLEURS-ASL數據集，蘋果開發的手指拼寫模型在FSBoard測試中達到6.7%的字符錯誤率（CER），在ASL Citizen數據集上實現74%的top-1準確率。這項技術有望顯著降低手語視頻標注的人力成本，為聽障群體創造更友好的數字交互環境。

在3D建模領域，蘋果提出的HeadsUp方法引發關注。該技術利用層級建模（LLM）技術，通過多角度圖像采集重建高質量3D頭部模型。測試使用的內部數據集包含超1萬名受試者的面部數據，規模較現有同類數據集擴大一個數量級。這項突破或與Vision Pro的Persona虛擬形象系統及visionOS的人臉捕捉技術密切相關，可能為用戶帶來更自然的表情渲染體驗。

蘋果全球營銷高級副總裁格雷格·喬斯維亞克曾公開表示，Vision Pro代表著數字與物理世界融合的必然趨勢。盡管他拒絕預測"空間計算"成為主流的具體時間表，但強調這一技術方向具有不可逆轉性。隨著三項研究成果的陸續公布，蘋果在空間計算領域的戰略布局正逐步清晰，其技術積累或將為下一代交互設備奠定基礎。

更多>同類內容

常州具身智能數據實驗平臺運營開啟真實場	螞蟻押注大曉機器人：具身智能突破虛擬，在
華為鴻蒙智行智界V9旗艦MPV來襲智能隱私調	百度AI價值重估：從昆侖芯布局到智能體矩陣

国产国产乱老视频网站97|高中少女桑桑的日常小说|欧美高清v doso|男生和女生一起生孩子短视频|含精入睡的青梅HH|欲望都市游戏|夫妻主找奴

蘋果發布三項AI研究新成果 持續深耕空間計算與Vision Pro頭顯領域

蘋果發布三項AI研究新成果持續深耕空間計算與Vision Pro頭顯領域