99热都是精品|亚洲精品精华液一区|日本综合视频|wallpaper原神18进入|国产农村一国产农村|穿越火线 兰|寡妇的肉体完整版

媒體界 - 推動中國媒體行業創新,促進業內人士交流分享!

米哈游新探索:100個AI智能體在虛擬世界開啟十年“人生”之旅

   發布時間:2026-06-26 21:01 作者:吳俊

學術網站Arxiv上近日出現了一篇引人矚目的論文,題為《Agentopia:智能體社會中的長期人生模擬與學習》。這項研究由米哈游創始人蔡浩宇創辦的AI公司Anuttacon主導,其核心團隊成員包括復旦大學計算機學院博士生王鑫濤等多位來自高校和企業的研究人員。他們共同開展了一項前所未有的實驗:讓100個具備自主意識的AI智能體在三個虛擬世界中生活十年,模擬真實人類的成長軌跡。

與傳統游戲中只會執行預設指令的NPC不同,這些AI智能體擁有獨立的性格、記憶、情感和目標。它們會經歷上學、工作、戀愛、交友等人生階段,甚至面臨職業轉型、社交倦怠和中年危機等現實問題。研究團隊構建了一個名為Agentopia的框架,將100個智能體分別置于紐約合租公寓、魔法學院和頂尖高中三個虛擬社會中,觀察它們在十年間的互動與演變。

實驗設計突破了以往智能體社會模擬的時間局限。過去類似研究通常僅持續數天,而Agentopia將時間跨度擴展至十年,以周為單位劃分規劃、社交、執行和回顧四個階段。智能體需自主制定計劃、發起社交邀約、參與活動,并在周末進行反思總結。支撐這一復雜系統的是三項關鍵技術:基于馬斯洛需求層次理論的生活獎勵機制、由生成式大模型驅動的環境引擎,以及文件系統式的長期記憶管理。

生活獎勵機制從社會地位、主觀幸福感和經濟狀況三個維度評估智能體狀態,成為訓練模型的核心反饋信號。環境引擎則摒棄了硬編碼規則,通過生成式模型判斷行為合理性、提供環境反饋、制造偶遇事件,甚至更新智能體檔案。長期記憶系統允許智能體跨周、跨年積累知識,通過自主管理的記憶文件實現行為持續性和成長性。例如,某智能體在九年間自信心從30分提升至80分,內向程度從95分降至65分,展現了顯著的性格轉變。

十年模擬結束后,研究團隊觀察到豐富的社會行為模式。友誼網絡從稀疏變得密集,公寓世界中的平均互惠友誼數從4.3增長至10.1。智能體展現出職業轉型能力,如某角色放棄高薪咨詢工作轉行登山向導。研究還發現反直覺規律:部分社交活躍的智能體社會地位評分下滑,因其社交廣度未轉化為深度;而另一些社會評分下降的智能體個人幸福感上升,源于主動選擇少而精的關系網絡。

這項研究對游戲行業具有潛在顛覆性影響。傳統游戲中NPC行為模式固定,無法適應玩家行動或環境變化,導致世界感斷裂。而Agentopia展示的智能體具備長期記憶和自主目標,能夠像真實人類一樣成長變化。例如,早期幫助玩家的小商人可能在數年后成為商會領袖,背叛玩家的同伴可能因愧疚改變行為模式。這些動態劇情無需編劇預設,而是由NPC自主思考產生。

從技術層面看,研究團隊利用模擬中產生的高質量智能體軌跡,通過拒絕采樣方式微調大語言模型,顯著提升了模型性能。這種方法不依賴昂貴的人類標注數據,而是利用智能體行為軌跡作為訓練樣本,其規模和多樣性遠超人工收集極限。對于需要大量NPC的游戲開發而言,這提供了一條成本可控且可規模化復制的路徑。

Anuttacon的研究方向與米哈游的IP生態擴張戰略高度契合。當前米哈游旗下《原神》《崩壞星穹鐵道》《絕區零》三款主力作品保持高頻更新,但內部框架相似性逐漸引發玩家審美疲勞。公司已公布涵蓋生活模擬、都市開放世界、射擊等多品類的預研項目,試圖開拓新運營模式。Agentopia技術若應用于游戲開發,可能推動NPC行為模式革新,使虛擬世界真正“活”起來。

這一實驗也重新定義了“世界模型”的概念。當前AI行業熱議的世界模型多聚焦物理世界模擬,旨在預測物體運動、場景變化,服務于自動駕駛和機器人控制。而Agentopia另辟蹊徑,專注于社會規律模擬,關注人類成長軌跡、人際關系演變和社會組織形式。這種差異源于游戲公司對內容創作的深度理解——游戲本質上是社會模擬的實驗場,數百萬玩家互動構成復雜社會關系網,為研究提供了獨特數據資產。

米哈游提出的2030年愿景是打造十億人生活的虛擬世界,這需要沉浸式視覺交互、智能NPC和穩定社會系統三大核心技術支撐。Agentopia實驗正致力于解決后兩個問題,其研究路線差異也反映了兩種世界觀的分野:物理世界模型認為理解人類是理解物理世界的副產品,而生活模擬路線則主張社交智能是通用人工智能的核心組成部分。這場由100個智能體開啟的十年實驗,或許只是構建虛擬社會的第一步。

 
 
更多>同類內容
全站最新
熱門內容
本欄最新