阿里巴巴達(dá)摩院今日宣布推出具身智能大腦基礎(chǔ)模型RynnBrain,并同步開(kāi)源包含30B MoE架構(gòu)在內(nèi)的7個(gè)全系列模型。該模型首次賦予機(jī)器人時(shí)空記憶與空間推理能力,在16項(xiàng)具身智能評(píng)測(cè)指標(biāo)中全面超越谷歌Gemini Robotics ER 1.5、英偉達(dá)Cosmos Reason 2等國(guó)際頂尖模型,刷新行業(yè)紀(jì)錄(SOTA)。
針對(duì)具身智能領(lǐng)域長(zhǎng)期存在的泛化能力瓶頸,達(dá)摩院研發(fā)團(tuán)隊(duì)突破傳統(tǒng)技術(shù)路徑,創(chuàng)造性地將時(shí)空記憶與物理世界推理機(jī)制融入模型架構(gòu)。時(shí)空記憶模塊使機(jī)器人能夠通過(guò)歷史軌跡定位物體位置、預(yù)測(cè)運(yùn)動(dòng)方向,實(shí)現(xiàn)全局時(shí)空回溯;物理空間推理則通過(guò)文本指令與空間定位的交替運(yùn)算,將推理過(guò)程深度綁定物理環(huán)境,有效降低傳統(tǒng)模型常見(jiàn)的"物理幻覺(jué)"問(wèn)題。實(shí)驗(yàn)顯示,搭載該模型的機(jī)器人在執(zhí)行多任務(wù)時(shí),可精準(zhǔn)記憶中斷前的任務(wù)狀態(tài),并在任務(wù)切換后無(wú)縫恢復(fù)操作。
基于Qwen3-VL框架優(yōu)化的RynnScale訓(xùn)練架構(gòu),使模型在同等計(jì)算資源下實(shí)現(xiàn)兩倍訓(xùn)練加速,依托超過(guò)2000萬(wàn)組訓(xùn)練數(shù)據(jù)構(gòu)建起多維能力體系。評(píng)測(cè)數(shù)據(jù)顯示,該模型在環(huán)境感知、視覺(jué)問(wèn)答、軌跡預(yù)測(cè)等核心場(chǎng)景中表現(xiàn)卓越,其認(rèn)知、定位、規(guī)劃等綜合能力較前代模型提升顯著。特別在具身規(guī)劃任務(wù)中,基于RynnBrain微調(diào)的專用模型僅需數(shù)百條訓(xùn)練數(shù)據(jù)即可超越Gemini 3 Pro,展現(xiàn)出強(qiáng)大的場(chǎng)景適應(yīng)能力。
此次開(kāi)源計(jì)劃包含全尺寸基礎(chǔ)模型與垂直領(lǐng)域?qū)S媚P停渲?0B MoE架構(gòu)模型通過(guò)動(dòng)態(tài)參數(shù)激活技術(shù),僅需3B活躍參數(shù)即可達(dá)到72B規(guī)模模型的性能水平,顯著提升機(jī)器人響應(yīng)速度與動(dòng)作流暢度。配套發(fā)布的RynnBrain-Bench評(píng)測(cè)基準(zhǔn),首次構(gòu)建了針對(duì)時(shí)空細(xì)粒度任務(wù)的評(píng)估體系,填補(bǔ)了行業(yè)在具身智能量化評(píng)估領(lǐng)域的空白。
據(jù)達(dá)摩院具身智能實(shí)驗(yàn)室負(fù)責(zé)人趙德麗介紹,RynnBrain通過(guò)構(gòu)建大腦對(duì)物理世界的深度理解框架,為通用具身智能的分層架構(gòu)發(fā)展奠定關(guān)鍵基礎(chǔ)。該模型已形成可擴(kuò)展的技術(shù)體系,支持快速衍生導(dǎo)航、操作等垂直領(lǐng)域模型。目前團(tuán)隊(duì)正推進(jìn)具身智能系統(tǒng)的全棧開(kāi)發(fā),此前已開(kāi)源世界模型融合方案WorldVLA、場(chǎng)景理解模型RynnEC及機(jī)器人通信協(xié)議RynnRCP等核心技術(shù)組件。















