黄色三级不卡在线观看-男男视频网站高清观看-久久国产欧美韩国精品app-免费观看妇女A级视频-中文字幕一区二区三区人妻在线视频-国产精选av一区二区-欧美亚洲精品不卡一区二区-99女福利女女视频在线播放-国产美女香蕉久久精品

  • 虎科技 - 領(lǐng)先的互聯(lián)網(wǎng)科技媒體

原阿里千問后訓(xùn)練核心郁博文離職后火速加盟 字節(jié)Seed多模態(tài)布局再添強援

   時間:2026-03-12 09:49 來源:天脈網(wǎng)作者:朱天宇

近日,科技行業(yè)傳來一則重磅人事變動消息:原阿里巴巴通義實驗室Qwen(千問)大模型后訓(xùn)練負責人郁博文,已正式加入字節(jié)跳動,擔任Seed團隊視覺模型與多模態(tài)交互團隊后訓(xùn)練負責人。這一變動引發(fā)了業(yè)界對大模型技術(shù)發(fā)展路徑的廣泛關(guān)注。

郁博文在學(xué)術(shù)領(lǐng)域有著深厚的積累。他本科就讀于中南大學(xué),之后在中國科學(xué)院信息工程研究所攻讀研究生,并于2022年獲得中國科學(xué)院大學(xué)博士學(xué)位。讀研期間,他專注于自然語言處理與信息抽取領(lǐng)域的研究,在ACL、EMNLP等國際頂級學(xué)術(shù)會議上發(fā)表過多篇論文。他創(chuàng)新性地提出將信息抽取任務(wù)轉(zhuǎn)化為圖結(jié)構(gòu)問題,有效解決了實體重疊、嵌套等復(fù)雜場景下的識別難題,憑借這些突出成果,他榮獲了中國科學(xué)院院長獎。

2022年博士畢業(yè)后,郁博文以阿里集團最高級別校招項目“阿里星”的身份加入阿里巴巴達摩院,擔任算法專家(P7)。入職初期,他就深度參與了通義千問大模型的早期訓(xùn)練與研發(fā)工作,憑借出色的能力迅速成長為千問團隊的核心骨干,并最終擔任后訓(xùn)練負責人。

在后訓(xùn)練崗位上,郁博文成績斐然。他主導(dǎo)了Qwen系列Chat模型的研發(fā),運用監(jiān)督微調(diào)(SFT)、強化學(xué)習(xí)(RLHF)、直接偏好優(yōu)化(DPO)等技術(shù),成功將通用大模型轉(zhuǎn)化為符合人類價值觀和使用習(xí)慣的對話模型。針對不同規(guī)模的模型,他設(shè)計了“四階段進化論”和“知識蒸餾”策略,使得Qwen模型在長文本生成、復(fù)雜推理及多模態(tài)理解等任務(wù)上表現(xiàn)出色。在LMSYS Chatbot Arena等全球權(quán)威評測中,Qwen系列多次進入前十名。

然而,2026年3月,阿里通義實驗室啟動了組織架構(gòu)調(diào)整,計劃將原本垂直整合的Qwen團隊拆分為預(yù)訓(xùn)練、后訓(xùn)練、文本、多模態(tài)等多個平行模塊。這一調(diào)整使得郁博文的管理范圍大幅縮小,而且與他堅持的“預(yù)訓(xùn)練與后訓(xùn)練必須深度耦合”的技術(shù)理念產(chǎn)生了沖突。阿里高層對千問團隊施加的商業(yè)化考核壓力,也進一步加劇了團隊內(nèi)部的分歧。

2026年3月3日,郁博文提交了辭職申請,并于次日正式離職。他的工作由前Google DeepMind高級資深研究員周浩接任。

字節(jié)Seed團隊近年來在大模型和多模態(tài)領(lǐng)域持續(xù)投入資源、積極布局。郁博文的加入,無疑將為該團隊在視覺與多模態(tài)交互方面的后訓(xùn)練能力帶來顯著提升,進一步推動字節(jié)在AI領(lǐng)域的發(fā)展。業(yè)界普遍認為,這一人事變動可能會引發(fā)大模型技術(shù)領(lǐng)域的新一輪競爭與合作格局的變化。

 
 
更多>同類內(nèi)容
推薦圖文
推薦內(nèi)容
點擊排行
 
智快科技微信賬號
ITBear微信賬號

微信掃一掃
加微信拉群
電動汽車群
科技數(shù)碼群