阿里云近日宣布,正式推出全新升級的多模態交互混合智能體——Qwen3.7-Plus。作為Qwen3.7的增強版本,該模型在視覺與語言融合領域實現突破性進展,成為全球首個同時支持圖像、視頻、屏幕、網頁及文本輸入的智能體基座。
技術層面,Qwen3.7-Plus在保留原有文本處理、代碼生成、工具調用等核心能力的基礎上,重點強化了視覺理解與跨模態推理能力。通過整合多模態感知系統,該模型可實現從GUI界面操作到命令行交互的全方位任務執行,特別針對復雜辦公場景進行優化,支持在各類軟件環境中自動完成流程化操作。
在權威評測機構Vision Arena發布的最新榜單中,阿里憑借Qwen3.7-Plus的卓越表現躋身全球前五,并登頂中國區榜首。純文本能力測試顯示,該模型在編碼智能體、多語言處理等維度已接近行業頂尖水平,尤其在指令遵循和復雜推理任務中展現出穩定性能。多模態專項評測中,其在BabyVision、MathVision等視覺推理基準測試中的準確率較前代提升超過30%,工具調用鏈路的完整性達到行業領先標準。
開發團隊透露,Qwen3.7-Plus已通過阿里云百煉平臺全面開放服務,開發者可在Qwen Studio體驗完整功能。該模型特別針對企業級應用進行優化,支持在安全合規的環境中處理敏感數據,目前已與多家金融機構達成合作試點,在合同智能解析、財務報表自動化等場景取得實質性進展。















