阿里Qwen3.7-Plus模型來襲：能編程造App，還能規(guī)劃路線、自動比價下單

發(fā)布時間：2026-06-03 15:10 來源：快訊作者：陳陽

阿里通義千問團隊近日宣布推出全新多模態(tài)智能體模型Qwen3.7-Plus，這款模型在傳統(tǒng)圖像識別基礎(chǔ)上實現(xiàn)了界面感知、工具調(diào)用、代碼生成和任務(wù)交付的深度融合，標(biāo)志著人工智能從"被動理解"向"主動執(zhí)行"的跨越式發(fā)展。該模型已在阿里云百煉平臺上線，開發(fā)者可通過OpenAI兼容API或Anthropic協(xié)議直接調(diào)用，同時Qwen Studio開放了在線體驗通道。

在基準(zhǔn)測試中，Qwen3.7-Plus展現(xiàn)出顯著優(yōu)勢：多模態(tài)推理方面，BabyVision得分70.4/64.7，超越Gemini 3.1 Pro的55.9和GPT-5.4（xhigh）的53.1；視覺編程領(lǐng)域，ScreenSpot Pro得分79.0，領(lǐng)先GPT-5.4（xhigh）11.6分。該模型在RealWorldQA測試中取得86.9分，較前代提升1.5分，證明其在真實場景解析能力上的持續(xù)進化。技術(shù)團隊創(chuàng)新性地構(gòu)建了"看-想-寫-做-驗"的端到端閉環(huán)系統(tǒng)，將GUI操作、CLI調(diào)用、代碼生成和結(jié)果驗證整合為統(tǒng)一智能體循環(huán)。

實際應(yīng)用測試中，模型展現(xiàn)了強大的任務(wù)執(zhí)行能力。在連續(xù)11小時的App開發(fā)測試中，Hybrid-Agent系統(tǒng)累計生成超10000行代碼，觸發(fā)1000余次工具調(diào)用，完整實現(xiàn)了單詞本、消消樂游戲、限時挑戰(zhàn)等12項功能模塊。更令人矚目的是，該模型成功復(fù)刻macOS原生Stocks應(yīng)用，不僅還原了暗色主題和分欄布局，還通過接入LongBridge API實現(xiàn)了實時行情數(shù)據(jù)的動態(tài)更新。技術(shù)文檔顯示，整個復(fù)刻過程涉及10項功能驗證測試，包括多周期視圖切換、搜索過濾等復(fù)雜交互場景。

針對視覺推理任務(wù)，模型開發(fā)了獨特的空間建模算法。在找不同測試中，系統(tǒng)通過坐標(biāo)比對和差異圖分析，準(zhǔn)確識別出5處細微差異；植物病害診斷場景下，模型經(jīng)過7次迭代檢索，綜合分析病斑顏色、紋理特征后給出專業(yè)判斷。對于復(fù)雜圖表處理，模型展現(xiàn)出驚人的路徑規(guī)劃能力，能夠在新加坡地鐵線路圖中自動規(guī)劃最優(yōu)換乘路線，準(zhǔn)確識別13條線路的21個換乘站點。

瀏覽器智能助手功能進一步拓展了應(yīng)用邊界。基于Chrome插件的Agent模式可感知網(wǎng)頁內(nèi)容并自動執(zhí)行多步操作，在ECS采購測試中，系統(tǒng)自動完成云服務(wù)器比價、鏡像配置和安全組設(shè)置，面對價格波動時能動態(tài)調(diào)整采購策略。技術(shù)白皮書顯示，該功能支持超過200種網(wǎng)頁元素的精準(zhǔn)識別，操作成功率達到92.3%。

更多>同類內(nèi)容