AI新賽道崛起！李飛飛Jeff Dean押注持續學習，讓模型在真實場景中越用越聰明

發布時間：2026-06-01 23:23 來源：快訊作者：朱天宇

在人工智能領域，一場關于模型進化路徑的變革正在悄然發生。當行業普遍聚焦于預訓練模型規模擴張時，一家名為Trajectory的初創公司另辟蹊徑，將目光投向模型在真實場景中的持續進化能力。這家由前Google DeepMind、Apple AI核心成員創立的企業，近日完成1500萬美元種子輪融資，投后估值達1.15億美元，投資方陣容包括Conviction、Bessemer Venture Partners等知名機構，更引人注目的是Google DeepMind首席科學家Jeff Dean與"AI教母"李飛飛的個人投資。

Trajectory的核心技術突破在于構建"反饋閉環"系統。與傳統模型訓練不同，該公司通過捕捉用戶與AI交互過程中的實時數據——包括接受建議、修改內容、撤回操作等行為信號，將其轉化為訓練樣本反哺模型優化。這種機制使得模型能夠突破靜態限制，實現每周一次的迭代更新。創始人Ronak Malde指出："當前最強AI仍是靜態系統，用戶今天遇到的錯誤，明天依然存在。我們通過持續學習打破這個循環。"

技術實現層面，Trajectory開發了標準化數據格式"Trajectory"，將智能體行為軌跡與產品遙測數據轉化為四層結構：完整對話（Trajectory）→交互輪次（Step）→用戶-AI回合（Turn）→單條消息（Message）。這種設計使每個交互步驟都成為自包含的訓練樣本，支持從LangSmith等觀測平臺直接接入企業數據。為解決合規難題，系統采用SOC 2認證架構，賦予客戶完全的數據控制權，所有模型更新均需通過客戶評估審批。

在法律科技領域，Harvey公司聯創Gabe Pereyra的評價印證了這項技術的價值："法律專業知識存在于不斷演變的判例體系中，通用大模型無法捕捉這種動態變化。持續學習機制為專業領域AI提供了關鍵基礎設施。"目前，Trajectory已與Clay、Harvey等AI原生企業達成合作，其客戶案例顯示，模型能夠從自身錯誤中學習并改進表現。

這家初創公司的技術路線與學術界前沿思考形成共振。2025年NeurIPS大會上，強化學習奠基人Rich Sutton在特邀演講中強調："真正的智能源于持續經驗積累，AI產業需要回歸智能體與環境交互的本質。"他提出的Oak架構愿景，與Trajectory的實踐方向不謀而合。作為RLHF（基于人類反饋的強化學習）技術的重要推動者，Sutton的論斷為持續學習路線提供了理論支撐。

當前，Trajectory已構建起包含11名頂尖研究員的團隊，成員來自OpenAI、meta超級智能實驗室等機構。盡管其模型更新周期仍為每周一次，尚未達到理論上的實時學習，但標準化訓練管線的建立標志著重要突破。聯合創始人Michael Elabd透露，團隊正在探索將更新周期壓縮至每日甚至每小時，最終實現"每個員工擁有專屬AI"的愿景。

這場變革揭示出AI基礎設施的新競爭維度。當開源模型生態日益成熟，企業競爭焦點正從模型本身轉向使模型持續進化的工程能力。數據治理、評估管線、安全合規等傳統被忽視的環節，正在成為新的技術護城河。Trajectory的實踐表明，在API調用模式之外，構建自主可控的模型進化系統，可能成為企業AI落地的關鍵路徑。

更多>同類內容