千問大模型團隊今日宣布推出全球首個原生語言世界模型Qwen-AgentWorld,該模型通過突破性技術架構實現了跨領域智能體交互環境的統一建模。與傳統方案不同,其核心創新在于將環境建模深度融入模型訓練全流程,從初始的繼續預訓練階段便確立為關鍵目標,并貫穿后續的監督微調(SFT)與強化學習(RL)階段,形成完整的建模閉環。
在應用場景覆蓋方面,Qwen-AgentWorld展現出前所未有的廣度。該模型通過單一架構同時支持四大文本交互環境(多輪對話MCP、網絡搜索Search、終端操作Terminal、軟件工程SWE)與三大圖形界面環境(網頁交互Web、操作系統OS、移動應用Android),實現跨模態知識的高效遷移。這種設計突破了傳統模型需要針對不同場景單獨訓練的局限,顯著提升了開發效率與場景適應性。
為確保模型評估的可靠性,研究團隊同步發布了AgentWorldBench評測基準。該基準覆蓋七大核心領域,每條測試樣本均包含真實環境執行產生的觀測數據,構建起從虛擬仿真到現實落地的評估閉環。目前,模型本體與評測工具集已通過Hugging Face和ModelScope平臺開放下載,為全球開發者提供完整的智能體開發解決方案。
技術文檔顯示,Qwen-AgentWorld在環境感知、任務規劃與執行反饋三個維度實現關鍵突破。通過動態環境建模機制,模型能夠實時感知交互環境的變化并調整策略;在跨領域任務處理時,可自動識別場景特征并調用對應的知識模塊。這種自適應能力使其在復雜任務處理中展現出接近人類水平的靈活性。














