黄色三级不卡在线观看-男男视频网站高清观看-久久国产欧美韩国精品app-免费观看妇女A级视频-中文字幕一区二区三区人妻在线视频-国产精选av一区二区-欧美亚洲精品不卡一区二区-99女福利女女视频在线播放-国产美女香蕉久久精品

  • 虎科技 - 領(lǐng)先的互聯(lián)網(wǎng)科技媒體

斯坦福博士創(chuàng)立Moonlake AI:用游戲開發(fā)訓(xùn)練世界模型 獲英偉達等投資布局未來

   時間:2026-02-26 18:29 來源:快訊作者:朱天宇

舊金山初創(chuàng)公司Moonlake AI近日宣布,其“世界建模智能體”已進入公開測試階段。該團隊同步發(fā)布的技術(shù)博客詳細拆解了保齡球小游戲的十階段開發(fā)流程:從3D網(wǎng)格資產(chǎn)生成、剛體物理參數(shù)配置、碰撞檢測算法搭建,到計分系統(tǒng)邏輯編寫、空間音頻融合及逆向運動學(xué)抓取動畫實現(xiàn),全程由AI自主完成。其beta版本產(chǎn)品能在15至20分鐘內(nèi),將自然語言描述轉(zhuǎn)化為具備物理反饋、可交互操作的完整游戲原型。

區(qū)別于傳統(tǒng)游戲生成工具,Moonlake的野心不止于簡化開發(fā)流程。創(chuàng)始人Fan-Yun Sun與Sharon Lee明確表示,該項目旨在通過游戲開發(fā)過程訓(xùn)練具備“世界運行規(guī)律”理解能力的AI模型。這種定位源于團隊核心成員的學(xué)術(shù)背景:Fan-Yun Sun在斯坦福攻讀博士期間,同時參與英偉達Omniverse項目,專注于大規(guī)模3D世界生成;Sharon Lee則深耕擴散模型與3D引擎的結(jié)合,致力于構(gòu)建空間理解基礎(chǔ)模型。兩人的研究領(lǐng)域形成閉環(huán)——前者解決虛擬世界構(gòu)建,后者賦予世界交互能力。

2025年10月,該公司結(jié)束隱身模式并宣布完成2800萬美元種子輪融資,由AIX Ventures、Threshold Ventures及英偉達旗下NVentures聯(lián)合領(lǐng)投。其天使投資人陣容堪稱豪華:YouTube聯(lián)合創(chuàng)始人Steve Chen、Google首席科學(xué)家Jeff Dean、GAN發(fā)明者Ian Goodfellow,以及來自Hugging Face、DeepMind等機構(gòu)的高管均參與投資。截至近期,融資總額已增至約3000萬美元,團隊規(guī)模約15人,成員包括ACM ICPC獎牌得主及國際奧賽獲獎?wù)摺?/p>

2025年12月發(fā)布的核心理念產(chǎn)品Reverie(生成式游戲引擎GGE),被團隊定義為首個“可編程世界模型”。其突破性在于實現(xiàn)狀態(tài)持久性——區(qū)別于Sora等視頻生成模型僅預(yù)測下一幀畫面的模式,Reverie通過綁定擴散模型與結(jié)構(gòu)化3D信號,確保虛擬世界中的變化能夠長期維持。例如,玩家打碎的花瓶不會在幾秒后自動復(fù)原。Sharon Lee在采訪中強調(diào):“生成式世界缺失的關(guān)鍵是控制權(quán),創(chuàng)作者需要定義變化的觸發(fā)條件、持續(xù)時間及影響范圍?!?/p>

技術(shù)架構(gòu)層面,Reverie采用“編排者”模式而非單一模型。當(dāng)用戶輸入自然語言指令后,系統(tǒng)會調(diào)用多個專業(yè)化第三方AI模型分工處理:空間布局由多模態(tài)推理模型完成,游戲邏輯依賴程序合成技術(shù),物理交互通過模擬層實現(xiàn),視覺渲染則交給實時擴散模型。Fan-Yun Sun透露,編排模型會隨時間推移逐步整合外部模型能力,形成自主融合多模態(tài)數(shù)據(jù)的系統(tǒng)。

官方博客以賽博朋克風(fēng)格保齡球游戲為例,展示系統(tǒng)推理流程:用戶僅提供“在街機房創(chuàng)建半寫實賽博朋克保齡球游戲”的簡短描述后,AI自動完成十個開發(fā)階段——從生成球道、球瓶的3D網(wǎng)格及PBR紋理,到配置摩擦系數(shù)0.4、彈性0.15的物理參數(shù);從設(shè)計空間布局與核心游戲邏輯,到管理球體生命周期、處理邊界異常、集成音頻及逆向運動學(xué)抓取系統(tǒng),最終通過用戶反饋優(yōu)化細節(jié)。整個過程無需人工干預(yù)架構(gòu)設(shè)計或代碼編寫。

Moonlake對“世界模型”的定義顯著區(qū)別于行業(yè)主流。當(dāng)前多數(shù)AI項目將“world model”簡化為視頻幀預(yù)測,如Google DeepMind的Genie 3可生成24幀/秒的3D導(dǎo)航環(huán)境,李飛飛團隊推出的Marble能從文本生成3D世界。而Moonlake認為,世界狀態(tài)不能被壓縮為像素集合。以保齡球瓶為例,其同時是空間中的紋理物體、具備質(zhì)量慣性的剛體、可被撞倒的目標(biāo)、計分符號實體及撞擊聲源。球擊中瓶子的瞬間,需同步更新變換矩陣、解析碰撞沖量、遞增比分、觸發(fā)音頻及推進重置計時器——任何模態(tài)的延遲都會導(dǎo)致世界不連貫。

基于此,團隊提出世界模型需編碼五大維度:幾何(變換、拓撲、空間關(guān)系)、物理(質(zhì)量、力、碰撞約束)、可供性(可行動作及執(zhí)行主體)、符號邏輯(規(guī)則、分數(shù)、狀態(tài)機)及感知映射(視覺投影與空間音頻)。這一框架更接近傳統(tǒng)游戲引擎的實際功能,而非單純追求視覺真實。

實際測試顯示,Reverie可快速生成游戲原型,但精細化打磨仍需人工介入。Fast Company記者在體驗中,首次嘗試制作3D地牢探險游戲失敗,僅生成布滿膠囊形角色的單房間場景;改做2D冰淇淋堆疊游戲時,初版雖在15分鐘內(nèi)完成核心玩法,但存在物理效果缺陷——冰淇淋無法正確堆疊,廚師角色顯示為白色粗糙圖形。經(jīng)過數(shù)小時反復(fù)調(diào)整需求,最終版本雖實現(xiàn)計分與結(jié)束畫面,但消耗了月度1500信用點中的950點(按40美元月費計算約25美元)。

Moonlake的長期目標(biāo)超越工具開發(fā)。團隊強調(diào),用戶每次糾正物理行為、補充游戲規(guī)則或調(diào)整因果關(guān)系,都在為多模態(tài)模型提供訓(xùn)練數(shù)據(jù)。Fan-Yun Sun對比現(xiàn)有數(shù)據(jù)采集方式指出:激光掃描房間獲取的是靜態(tài)數(shù)據(jù),視頻分析缺乏人類語境,單一游戲數(shù)據(jù)(如《堡壘之夜》錄像)難以泛化至真實世界。而用戶交互天然包含意圖與反饋,屬于因果數(shù)據(jù)。若用戶基數(shù)形成規(guī)模,數(shù)據(jù)量將呈指數(shù)級增長,推動模型能力持續(xù)提升。目前,團隊已收到制造業(yè)企業(yè)的咨詢,探索將技術(shù)應(yīng)用于機器人訓(xùn)練、自動駕駛及人因分析領(lǐng)域。不過,其beta版每日僅開放100個測試名額,距離構(gòu)建數(shù)據(jù)飛輪仍有較大差距。

 
 
更多>同類內(nèi)容
推薦圖文
推薦內(nèi)容
點擊排行
 
智快科技微信賬號
ITBear微信賬號

微信掃一掃
加微信拉群
電動汽車群
科技數(shù)碼群