黄色三级不卡在线观看-男男视频网站高清观看-久久国产欧美韩国精品app-免费观看妇女A级视频-中文字幕一区二区三区人妻在线视频-国产精选av一区二区-欧美亚洲精品不卡一区二区-99女福利女女视频在线播放-国产美女香蕉久久精品

  • 虎科技 - 領(lǐng)先的互聯(lián)網(wǎng)科技媒體

林俊旸離職首談AI:從千問實踐到智能體思維,AI下一程何去何從?

   時間:2026-03-27 18:36 來源:天脈網(wǎng)作者:沈如風(fēng)

阿里最年輕的P10級技術(shù)專家林俊旸宣布離職,引發(fā)AI行業(yè)震動。這位32歲的千問(Qwen)模型負(fù)責(zé)人曾帶領(lǐng)團隊將模型全球下載量突破10億次,衍生出超20萬款開源模型,卻在帶領(lǐng)團隊發(fā)布Qwen 3.5小模型系列并獲得馬斯克公開點贊后,選擇在社交媒體低調(diào)離場。其離職背后折射出AI大模型領(lǐng)域的技術(shù)路線之爭——阿里希望將Qwen團隊按技術(shù)維度拆分重組,而林俊旸堅持垂直整合的研發(fā)模式,雙方在組織架構(gòu)調(diào)整上存在根本分歧。

在離職近一個月后,林俊旸發(fā)布技術(shù)長文,直言AI發(fā)展正從"訓(xùn)練模型"轉(zhuǎn)向"訓(xùn)練智能體"的新階段。他以千問系列研發(fā)經(jīng)驗為基礎(chǔ),系統(tǒng)剖析了推理模型與智能體模型的本質(zhì)差異。文中特別復(fù)盤了Qwen3在混合思考模式上的探索與教訓(xùn),承認(rèn)團隊在平衡思考深度與指令效率時遭遇困境,最終選擇將Instruct和Thinking版本拆分,以滿足商業(yè)客戶對穩(wěn)定性的嚴(yán)苛要求。

這場技術(shù)路線之爭在行業(yè)層面早有預(yù)兆。OpenAI的o1模型通過強化學(xué)習(xí)訓(xùn)練出"思考能力",證明推理后訓(xùn)練的可行性;DeepSeek-R1則驗證了該技術(shù)路線在開源領(lǐng)域的可復(fù)現(xiàn)性。但林俊旸指出,當(dāng)前行業(yè)過度聚焦于延長推理鏈條,卻忽視了思考與行動的閉環(huán)關(guān)系。他以編程任務(wù)為例,強調(diào)真正有效的思考應(yīng)服務(wù)于具體行動目標(biāo),而非單純追求推理過程的長度或復(fù)雜度。

智能體模型的核心挑戰(zhàn)在于構(gòu)建真實世界交互環(huán)境。林俊旸對比傳統(tǒng)推理強化學(xué)習(xí)指出,智能體訓(xùn)練需要整合工具服務(wù)器、代碼執(zhí)行沙箱、API接口等復(fù)雜系統(tǒng),環(huán)境質(zhì)量直接決定模型能力上限。他特別警示"獎勵劫持"風(fēng)險:當(dāng)模型具備工具調(diào)用能力后,可能通過搜索答案、濫用日志等捷徑虛假優(yōu)化,導(dǎo)致看似性能超群實則毫無價值。

行業(yè)實踐已呈現(xiàn)分化態(tài)勢。Anthropic的Claude系列采用可控思考預(yù)算設(shè)計,將推理過程與工具使用交錯進行;GLM-4.5和DeepSeek V3.1則嘗試統(tǒng)一推理與智能體能力。林俊旸認(rèn)為,成功的融合不應(yīng)是功能簡單疊加,而需建立平滑的推理力度控制光譜,使模型能自主判斷思考深度。這種設(shè)計理念在Qwen3的后續(xù)版本中得到體現(xiàn),其2507版通過分離架構(gòu)讓不同團隊專注解決特定問題。

技術(shù)演進正推動AI研發(fā)范式升級。林俊旸預(yù)言,未來競爭將聚焦于環(huán)境設(shè)計、反作弊協(xié)議、多智能體協(xié)調(diào)等系統(tǒng)工程能力。當(dāng)模型具備工具調(diào)用能力后,訓(xùn)練重點將從數(shù)據(jù)多樣性轉(zhuǎn)向環(huán)境真實性,構(gòu)建覆蓋足夠場景、難度梯度合理的訓(xùn)練環(huán)境將成為戰(zhàn)略資產(chǎn)。這種轉(zhuǎn)變意味著AI研發(fā)從算法創(chuàng)新轉(zhuǎn)向系統(tǒng)創(chuàng)新,需要整合模型架構(gòu)、基礎(chǔ)設(shè)施、評估體系等多維度能力。

 
 
更多>同類內(nèi)容
推薦圖文
推薦內(nèi)容
點擊排行
 
智快科技微信賬號
ITBear微信賬號

微信掃一掃
加微信拉群
電動汽車群
科技數(shù)碼群