99热都是精品|亚洲精品精华液一区|日本综合视频|wallpaper原神18进入|国产农村一国产农村|穿越火线 兰|寡妇的肉体完整版

媒體界 - 推動中國媒體行業(yè)創(chuàng)新,促進業(yè)內(nèi)人士交流分享!

螞蟻數(shù)科AoE框架:低成本輕量化方案破解具身數(shù)據(jù)采集難題

   發(fā)布時間:2026-03-03 18:03 作者:蘇婉清

具身智能領(lǐng)域迎來一項關(guān)鍵技術(shù)進展——螞蟻數(shù)科天璣實驗室團隊開發(fā)的AoE持續(xù)性第一人稱視頻采集框架,成功攻克了低成本、規(guī)?;瘮?shù)據(jù)采集難題。該方案通過“手機+頸掛式支架”的輕量化組合,將傳統(tǒng)需要數(shù)萬美元的專業(yè)設(shè)備成本壓縮至20美元以內(nèi),為具身智能訓練提供了可復制的解決方案。相關(guān)技術(shù)論文已在國際學術(shù)平臺Arxiv公開,標志著數(shù)據(jù)采集環(huán)節(jié)的技術(shù)壁壘被實質(zhì)性突破。

技術(shù)核心在于將人體自然交互過程轉(zhuǎn)化為標準化數(shù)據(jù)源。團隊設(shè)計的頸掛式支架采用人體工學結(jié)構(gòu),通過磁吸與機械夾具雙重固定方式,確保手機在胸前穩(wěn)定采集第一視角畫面。這種設(shè)計不僅支持毫米級軌跡追蹤,還能保持90%以上的手部關(guān)鍵點識別精度。實驗數(shù)據(jù)顯示,在Unitree G1機器人執(zhí)行關(guān)電腦任務(wù)中,僅需200條AoE采集的數(shù)據(jù),即可將操作成功率從45%提升至95%,顯著優(yōu)于傳統(tǒng)遙操作數(shù)據(jù)的訓練效果。

針對長視頻處理難題,研究團隊構(gòu)建了端云協(xié)同的自動化流水線。端側(cè)輕量級視覺模型可實時識別手物交互行為并觸發(fā)精準錄制,大語言-視覺融合模型則將連續(xù)視頻切割為帶語義標簽的原子動作片段。云端系統(tǒng)進一步完成自動標注、異常數(shù)據(jù)過濾等處理,最終生成可直接用于模型訓練的結(jié)構(gòu)化數(shù)據(jù)。這種處理方式使數(shù)千臺設(shè)備并發(fā)采集成為可能,同時將人工干預環(huán)節(jié)減少80%以上。

該技術(shù)的產(chǎn)業(yè)化應用已進入快車道。AoE框架不僅解決了數(shù)據(jù)采集的“啟動學習”問題,更通過標準化流程降低了AI訓練門檻。以金融場景為例,某銀行采用該方案后,柜員操作數(shù)據(jù)采集效率提升3倍,模型迭代周期縮短60%。這種低成本、高效率的數(shù)據(jù)生產(chǎn)模式,正在重塑具身智能的技術(shù)生態(tài)。

螞蟻數(shù)科的技術(shù)布局呈現(xiàn)明顯的產(chǎn)業(yè)導向特征。天璣實驗室同步推進AI+數(shù)據(jù)、AI+安全、AI+金融等四大方向,其研發(fā)的企業(yè)級大模型產(chǎn)品即將面世。今年初成立的“大模型技術(shù)創(chuàng)新部”,已啟動面向制造業(yè)、物流業(yè)的垂直領(lǐng)域模型開發(fā),預計年內(nèi)將落地5個以上行業(yè)解決方案。

 
 
更多>同類內(nèi)容
全站最新
熱門內(nèi)容
本欄最新