99热都是精品|亚洲精品精华液一区|日本综合视频|wallpaper原神18进入|国产农村一国产农村|穿越火线 兰|寡妇的肉体完整版

媒體界 - 推動中國媒體行業創新,促進業內人士交流分享!

AI新賽道崛起!李飛飛Jeff Dean押注持續學習,讓模型在真實場景中越用越聰明

   發布時間:2026-06-01 23:23 作者:朱天宇

在人工智能領域,一場關于模型進化路徑的變革正在悄然發生。當行業普遍聚焦于預訓練模型規模擴張時,一家名為Trajectory的初創公司另辟蹊徑,將目光投向模型在真實場景中的持續進化能力。這家由前Google DeepMind、Apple AI核心成員創立的企業,近日完成1500萬美元種子輪融資,投后估值達1.15億美元,投資方陣容包括Conviction、Bessemer Venture Partners等知名機構,更引人注目的是Google DeepMind首席科學家Jeff Dean與"AI教母"李飛飛的個人投資。

Trajectory的核心技術突破在于構建"反饋閉環"系統。與傳統模型訓練不同,該公司通過捕捉用戶與AI交互過程中的實時數據——包括接受建議、修改內容、撤回操作等行為信號,將其轉化為訓練樣本反哺模型優化。這種機制使得模型能夠突破靜態限制,實現每周一次的迭代更新。創始人Ronak Malde指出:"當前最強AI仍是靜態系統,用戶今天遇到的錯誤,明天依然存在。我們通過持續學習打破這個循環。"

技術實現層面,Trajectory開發了標準化數據格式"Trajectory",將智能體行為軌跡與產品遙測數據轉化為四層結構:完整對話(Trajectory)→交互輪次(Step)→用戶-AI回合(Turn)→單條消息(Message)。這種設計使每個交互步驟都成為自包含的訓練樣本,支持從LangSmith等觀測平臺直接接入企業數據。為解決合規難題,系統采用SOC 2認證架構,賦予客戶完全的數據控制權,所有模型更新均需通過客戶評估審批。

在法律科技領域,Harvey公司聯創Gabe Pereyra的評價印證了這項技術的價值:"法律專業知識存在于不斷演變的判例體系中,通用大模型無法捕捉這種動態變化。持續學習機制為專業領域AI提供了關鍵基礎設施。"目前,Trajectory已與Clay、Harvey等AI原生企業達成合作,其客戶案例顯示,模型能夠從自身錯誤中學習并改進表現。

這家初創公司的技術路線與學術界前沿思考形成共振。2025年NeurIPS大會上,強化學習奠基人Rich Sutton在特邀演講中強調:"真正的智能源于持續經驗積累,AI產業需要回歸智能體與環境交互的本質。"他提出的Oak架構愿景,與Trajectory的實踐方向不謀而合。作為RLHF(基于人類反饋的強化學習)技術的重要推動者,Sutton的論斷為持續學習路線提供了理論支撐。

當前,Trajectory已構建起包含11名頂尖研究員的團隊,成員來自OpenAI、meta超級智能實驗室等機構。盡管其模型更新周期仍為每周一次,尚未達到理論上的實時學習,但標準化訓練管線的建立標志著重要突破。聯合創始人Michael Elabd透露,團隊正在探索將更新周期壓縮至每日甚至每小時,最終實現"每個員工擁有專屬AI"的愿景。

這場變革揭示出AI基礎設施的新競爭維度。當開源模型生態日益成熟,企業競爭焦點正從模型本身轉向使模型持續進化的工程能力。數據治理、評估管線、安全合規等傳統被忽視的環節,正在成為新的技術護城河。Trajectory的實踐表明,在API調用模式之外,構建自主可控的模型進化系統,可能成為企業AI落地的關鍵路徑。

 
 
更多>同類內容
全站最新
熱門內容
本欄最新