meta近日正式推出全新原生多模態(tài)推理模型“Muse Spark”,這是該公司重組人工智能團(tuán)隊(duì)后發(fā)布的首個(gè)重要成果。該模型由meta超級(jí)智能實(shí)驗(yàn)室主導(dǎo)開發(fā),標(biāo)志著公司在AI領(lǐng)域的技術(shù)布局進(jìn)入新階段。
作為Muse系列的首款產(chǎn)品,Muse Spark具備三大核心能力:支持工具調(diào)用、可視化思維鏈展示以及多智能體協(xié)同工作。實(shí)驗(yàn)室負(fù)責(zé)人透露,該模型在開發(fā)過程中整合了來自Scale AI創(chuàng)始人Alexandr Wang等頂尖專家的技術(shù)經(jīng)驗(yàn),這也是Wang加入meta后主導(dǎo)的首個(gè)重大項(xiàng)目。
與meta過往的開源策略不同,此次發(fā)布的模型采用閉源架構(gòu),核心代碼和技術(shù)細(xì)節(jié)不對(duì)外公開。不過公司表示,未來仍會(huì)繼續(xù)開發(fā)開源模型,同時(shí)考慮通過API接口形式向企業(yè)用戶提供Muse Spark的付費(fèi)服務(wù)。這種雙軌策略既保護(hù)了技術(shù)壁壘,又為商業(yè)化鋪平道路。
性能測(cè)試顯示,該模型在多模態(tài)感知和復(fù)雜推理任務(wù)中表現(xiàn)突出。特別配備的“思考模式”通過協(xié)調(diào)多個(gè)智能體并行運(yùn)算,顯著提升了處理難題的能力。在被稱為“人類終極考試”的HLE測(cè)試中取得58%的完成率,在前沿科學(xué)研究任務(wù)中達(dá)到38%的準(zhǔn)確率,這些數(shù)據(jù)均優(yōu)于同類競(jìng)品。
在應(yīng)用場(chǎng)景方面,Muse Spark將深度整合到meta社交生態(tài)中。目前已在Instagram等平臺(tái)的購物助手功能中投入測(cè)試,能夠幫助用戶快速匹配服裝、家具等商品信息。公司高管特別指出,該模型在科學(xué)、健康和數(shù)學(xué)領(lǐng)域的解答質(zhì)量接近專業(yè)研究水平,但在編程能力上仍有提升空間。
為滿足不同場(chǎng)景需求,模型設(shè)計(jì)了三級(jí)推理模式:即時(shí)模式提供快速響應(yīng),思考模式進(jìn)行深度分析,沉思模式則生成研究級(jí)報(bào)告。這種分層架構(gòu)既保證了響應(yīng)速度,又能處理復(fù)雜問題,為未來擴(kuò)展商業(yè)應(yīng)用奠定基礎(chǔ)。















