99热都是精品|亚洲精品精华液一区|日本综合视频|wallpaper原神18进入|国产农村一国产农村|穿越火线 兰|寡妇的肉体完整版

媒體界 - 推動中國媒體行業(yè)創(chuàng)新,促進業(yè)內(nèi)人士交流分享!

阿里Qwen3.7-Plus模型來襲:能編程造App,還能規(guī)劃路線、自動比價下單

   發(fā)布時間:2026-06-03 15:10 作者:陳陽

阿里通義千問團隊近日宣布推出全新多模態(tài)智能體模型Qwen3.7-Plus,這款模型在傳統(tǒng)圖像識別基礎(chǔ)上實現(xiàn)了界面感知、工具調(diào)用、代碼生成和任務(wù)交付的深度融合,標(biāo)志著人工智能從"被動理解"向"主動執(zhí)行"的跨越式發(fā)展。該模型已在阿里云百煉平臺上線,開發(fā)者可通過OpenAI兼容API或Anthropic協(xié)議直接調(diào)用,同時Qwen Studio開放了在線體驗通道。

在基準(zhǔn)測試中,Qwen3.7-Plus展現(xiàn)出顯著優(yōu)勢:多模態(tài)推理方面,BabyVision得分70.4/64.7,超越Gemini 3.1 Pro的55.9和GPT-5.4(xhigh)的53.1;視覺編程領(lǐng)域,ScreenSpot Pro得分79.0,領(lǐng)先GPT-5.4(xhigh)11.6分。該模型在RealWorldQA測試中取得86.9分,較前代提升1.5分,證明其在真實場景解析能力上的持續(xù)進化。技術(shù)團隊創(chuàng)新性地構(gòu)建了"看-想-寫-做-驗"的端到端閉環(huán)系統(tǒng),將GUI操作、CLI調(diào)用、代碼生成和結(jié)果驗證整合為統(tǒng)一智能體循環(huán)。

實際應(yīng)用測試中,模型展現(xiàn)了強大的任務(wù)執(zhí)行能力。在連續(xù)11小時的App開發(fā)測試中,Hybrid-Agent系統(tǒng)累計生成超10000行代碼,觸發(fā)1000余次工具調(diào)用,完整實現(xiàn)了單詞本、消消樂游戲、限時挑戰(zhàn)等12項功能模塊。更令人矚目的是,該模型成功復(fù)刻macOS原生Stocks應(yīng)用,不僅還原了暗色主題和分欄布局,還通過接入LongBridge API實現(xiàn)了實時行情數(shù)據(jù)的動態(tài)更新。技術(shù)文檔顯示,整個復(fù)刻過程涉及10項功能驗證測試,包括多周期視圖切換、搜索過濾等復(fù)雜交互場景。

針對視覺推理任務(wù),模型開發(fā)了獨特的空間建模算法。在找不同測試中,系統(tǒng)通過坐標(biāo)比對和差異圖分析,準(zhǔn)確識別出5處細微差異;植物病害診斷場景下,模型經(jīng)過7次迭代檢索,綜合分析病斑顏色、紋理特征后給出專業(yè)判斷。對于復(fù)雜圖表處理,模型展現(xiàn)出驚人的路徑規(guī)劃能力,能夠在新加坡地鐵線路圖中自動規(guī)劃最優(yōu)換乘路線,準(zhǔn)確識別13條線路的21個換乘站點。

瀏覽器智能助手功能進一步拓展了應(yīng)用邊界。基于Chrome插件的Agent模式可感知網(wǎng)頁內(nèi)容并自動執(zhí)行多步操作,在ECS采購測試中,系統(tǒng)自動完成云服務(wù)器比價、鏡像配置和安全組設(shè)置,面對價格波動時能動態(tài)調(diào)整采購策略。技術(shù)白皮書顯示,該功能支持超過200種網(wǎng)頁元素的精準(zhǔn)識別,操作成功率達到92.3%。

 
 
更多>同類內(nèi)容
全站最新
熱門內(nèi)容
本欄最新