前阿里巴巴千問大模型技術負責人林俊旸的創業計劃引發行業高度關注。據多方消息透露,這位曾主導Qwen系列模型研發的核心人物,正在籌備一家尚未命名的AI初創企業,其種子輪融資目標估值已達20億美元(約合135億元人民幣)。這一數字對于尚未推出產品的中國AI公司而言堪稱罕見,但與硅谷同類企業相比仍屬合理區間。
林俊旸的AI技術履歷堪稱豪華。2019年加入阿里后,他先后主導了搜索推薦場景下的自然語言處理、多模態建模等關鍵項目,2020年起轉向大規模預訓練模型研究,深度參與M6超大規模模型開發。2022年擔任Qwen項目技術負責人期間,他帶領團隊構建了覆蓋不同參數規模、支持二次開發的完整模型矩陣,使Qwen成為阿里AI技術輸出的重要窗口。該系列模型在開發者社區廣受好評,其開源策略和持續迭代能力為行業樹立了標桿。
行業觀察人士指出,林俊旸的創業之所以備受矚目,與其在Qwen項目積累的技術資產和行業資源密不可分。據The Information報道,已有兩家國際知名投資機構與該創業團隊進入深度談判階段,這從側面印證了資本市場對其技術路線的高度認可。當前AI領域正經歷從基礎模型研發向應用落地的關鍵轉型,具備大模型全鏈條開發經驗的技術團隊顯得尤為稀缺。
林俊旸離職后發表的技術長文《From "Reasoning" Thinking to "Agentic" Thinking》,被視為其創業方向的重要技術宣言。在這篇萬字長文中,他提出AI發展正從"推理思維"向"智能體思維"演進的核心觀點。傳統模型通過增加推理算力提升認知能力,而未來競爭焦點將轉向讓模型在真實環境中通過行動-反饋-修正的閉環持續優化。這種轉變要求重新定義訓練范式,將環境設計、軌跡采樣、多智能體協調等要素納入核心研究框架。
技術細節方面,林俊旸特別強調代碼庫導航、任務拆解、錯誤恢復等實用場景的價值。他指出,在智能體工作流中,模型需要具備在復雜環境中自主規劃、調用工具并處理突發狀況的能力。這種能力不僅依賴模型架構創新,更需要構建完整的訓練-推理耦合系統,以及能夠準確評估真實世界行動效果的評估機制。這種技術路線與當前主流的"大模型+工具調用"方案形成鮮明對比,可能代表下一代AI系統的演進方向。
盡管林俊旸近期在社交媒體保持低調,但其轉發持續學習基準測試相關內容的舉動,仍引發外界對其創業方向的諸多猜測。有分析認為,這可能暗示其團隊正在構建新型模型評估體系,以支撐智能體思維的技術落地。隨著更多細節逐步披露,這家神秘初創公司有望成為AI領域的重要變量。
















