99热都是精品|亚洲精品精华液一区|日本综合视频|wallpaper原神18进入|国产农村一国产农村|穿越火线 兰|寡妇的肉体完整版

媒體界 - 推動(dòng)中國(guó)媒體行業(yè)創(chuàng)新,促進(jìn)業(yè)內(nèi)人士交流分享!

雷軍宣布小米AI研究大放異彩 多篇成果入選ICLR 2026 涵蓋多領(lǐng)域創(chuàng)新

   發(fā)布時(shí)間:2026-02-03 12:40 作者:李娜

近日,小米公司在人工智能領(lǐng)域的研究成果引發(fā)廣泛關(guān)注。其團(tuán)隊(duì)有多篇論文成功入選國(guó)際頂級(jí)會(huì)議ICLR 2026,研究范疇覆蓋多模態(tài)推理、強(qiáng)化學(xué)習(xí)、GUI Agent、端到端自動(dòng)駕駛以及音頻生成等多個(gè)前沿方向。ICLR作為人工智能領(lǐng)域極具影響力的學(xué)術(shù)會(huì)議,始終致力于推動(dòng)該領(lǐng)域理論與方法的前沿探索與創(chuàng)新發(fā)展。

在強(qiáng)化學(xué)習(xí)領(lǐng)域,小米團(tuán)隊(duì)提出的《Shuffle-R1》成果頗具創(chuàng)新性。該研究構(gòu)建了數(shù)據(jù)動(dòng)態(tài)重組框架,核心在于運(yùn)用成對(duì)軌跡采樣和優(yōu)勢(shì)值批次重排序兩項(xiàng)關(guān)鍵技術(shù)。這一創(chuàng)新有效解決了多模態(tài)大模型訓(xùn)練過(guò)程中存在的優(yōu)勢(shì)坍縮與軌跡沉默難題,大幅提升了梯度信號(hào)質(zhì)量。在多個(gè)基準(zhǔn)測(cè)試中,該成果以極低的計(jì)算開(kāi)銷(xiāo)超越了現(xiàn)有的強(qiáng)化學(xué)習(xí)基線水平。

移動(dòng)智能體方向,小米團(tuán)隊(duì)的《MobileIPL》同樣表現(xiàn)亮眼。團(tuán)隊(duì)首創(chuàng)迭代偏好學(xué)習(xí)框架,借助Thinking-level DPO實(shí)現(xiàn)思考步驟的細(xì)粒度優(yōu)化。同時(shí),結(jié)合三階段指令演化機(jī)制,成功突破了高質(zhì)量軌跡稀缺這一瓶頸。在AITZ等主流GUI-Agent測(cè)試中,該成果刷新了性能紀(jì)錄,并且在分布外場(chǎng)景下展現(xiàn)出更強(qiáng)的魯棒性。

端到端自動(dòng)駕駛研究方面,小米團(tuán)隊(duì)的《ReCogDrive》實(shí)現(xiàn)了技術(shù)融合創(chuàng)新。研究通過(guò)分層認(rèn)知數(shù)據(jù)流水線,將駕駛先驗(yàn)知識(shí)注入其中,利用認(rèn)知引導(dǎo)擴(kuò)散規(guī)劃器生成物理可行的軌跡。還首創(chuàng)DiffGRPO強(qiáng)化學(xué)習(xí)算法,直接對(duì)駕駛策略進(jìn)行優(yōu)化。在NAVSIM與Bench2Drive的閉環(huán)測(cè)試中,該成果領(lǐng)先于現(xiàn)有方案。

除了上述成果,小米團(tuán)隊(duì)還有其他創(chuàng)新研究。《ThinkOmni》實(shí)現(xiàn)了文本推理能力向全模態(tài)的零成本遷移;《Flow2GAN》融合流匹配與對(duì)抗生成技術(shù),實(shí)現(xiàn)了高保真少步音頻合成;《WorldSplat》則在4D駕駛場(chǎng)景生成技術(shù)上取得突破。

 
 
更多>同類內(nèi)容
全站最新
熱門(mén)內(nèi)容
本欄最新