黄色三级不卡在线观看-男男视频网站高清观看-久久国产欧美韩国精品app-免费观看妇女A级视频-中文字幕一区二区三区人妻在线视频-国产精选av一区二区-欧美亚洲精品不卡一区二区-99女福利女女视频在线播放-国产美女香蕉久久精品

  • 虎科技 - 領(lǐng)先的互聯(lián)網(wǎng)科技媒體

螞蟻數(shù)科AoE框架:低成本輕量化方案破解具身數(shù)據(jù)采集難題

   時間:2026-03-03 18:03 來源:互聯(lián)網(wǎng)作者:蘇婉清

具身智能領(lǐng)域迎來一項(xiàng)關(guān)鍵技術(shù)進(jìn)展——螞蟻數(shù)科天璣實(shí)驗(yàn)室團(tuán)隊(duì)開發(fā)的AoE持續(xù)性第一人稱視頻采集框架,成功攻克了低成本、規(guī)模化數(shù)據(jù)采集難題。該方案通過“手機(jī)+頸掛式支架”的輕量化組合,將傳統(tǒng)需要數(shù)萬美元的專業(yè)設(shè)備成本壓縮至20美元以內(nèi),為具身智能訓(xùn)練提供了可復(fù)制的解決方案。相關(guān)技術(shù)論文已在國際學(xué)術(shù)平臺Arxiv公開,標(biāo)志著數(shù)據(jù)采集環(huán)節(jié)的技術(shù)壁壘被實(shí)質(zhì)性突破。

技術(shù)核心在于將人體自然交互過程轉(zhuǎn)化為標(biāo)準(zhǔn)化數(shù)據(jù)源。團(tuán)隊(duì)設(shè)計(jì)的頸掛式支架采用人體工學(xué)結(jié)構(gòu),通過磁吸與機(jī)械夾具雙重固定方式,確保手機(jī)在胸前穩(wěn)定采集第一視角畫面。這種設(shè)計(jì)不僅支持毫米級軌跡追蹤,還能保持90%以上的手部關(guān)鍵點(diǎn)識別精度。實(shí)驗(yàn)數(shù)據(jù)顯示,在Unitree G1機(jī)器人執(zhí)行關(guān)電腦任務(wù)中,僅需200條AoE采集的數(shù)據(jù),即可將操作成功率從45%提升至95%,顯著優(yōu)于傳統(tǒng)遙操作數(shù)據(jù)的訓(xùn)練效果。

針對長視頻處理難題,研究團(tuán)隊(duì)構(gòu)建了端云協(xié)同的自動化流水線。端側(cè)輕量級視覺模型可實(shí)時識別手物交互行為并觸發(fā)精準(zhǔn)錄制,大語言-視覺融合模型則將連續(xù)視頻切割為帶語義標(biāo)簽的原子動作片段。云端系統(tǒng)進(jìn)一步完成自動標(biāo)注、異常數(shù)據(jù)過濾等處理,最終生成可直接用于模型訓(xùn)練的結(jié)構(gòu)化數(shù)據(jù)。這種處理方式使數(shù)千臺設(shè)備并發(fā)采集成為可能,同時將人工干預(yù)環(huán)節(jié)減少80%以上。

該技術(shù)的產(chǎn)業(yè)化應(yīng)用已進(jìn)入快車道。AoE框架不僅解決了數(shù)據(jù)采集的“啟動學(xué)習(xí)”問題,更通過標(biāo)準(zhǔn)化流程降低了AI訓(xùn)練門檻。以金融場景為例,某銀行采用該方案后,柜員操作數(shù)據(jù)采集效率提升3倍,模型迭代周期縮短60%。這種低成本、高效率的數(shù)據(jù)生產(chǎn)模式,正在重塑具身智能的技術(shù)生態(tài)。

螞蟻數(shù)科的技術(shù)布局呈現(xiàn)明顯的產(chǎn)業(yè)導(dǎo)向特征。天璣實(shí)驗(yàn)室同步推進(jìn)AI+數(shù)據(jù)、AI+安全、AI+金融等四大方向,其研發(fā)的企業(yè)級大模型產(chǎn)品即將面世。今年初成立的“大模型技術(shù)創(chuàng)新部”,已啟動面向制造業(yè)、物流業(yè)的垂直領(lǐng)域模型開發(fā),預(yù)計(jì)年內(nèi)將落地5個以上行業(yè)解決方案。

 
 
更多>同類內(nèi)容
推薦圖文
推薦內(nèi)容
點(diǎn)擊排行
 
智快科技微信賬號
ITBear微信賬號

微信掃一掃
加微信拉群
電動汽車群
科技數(shù)碼群