黄色三级不卡在线观看-男男视频网站高清观看-久久国产欧美韩国精品app-免费观看妇女A级视频-中文字幕一区二区三区人妻在线视频-国产精选av一区二区-欧美亚洲精品不卡一区二区-99女福利女女视频在线播放-国产美女香蕉久久精品

  • 虎科技 - 領(lǐng)先的互聯(lián)網(wǎng)科技媒體

小米發(fā)布MoE大模型MiMo-V2-Flash,性能媲美頂尖模型,多項(xiàng)實(shí)測(cè)表現(xiàn)亮眼

   時(shí)間:2025-12-18 00:05 來(lái)源:快訊作者:柳晴雪

小米今日正式發(fā)布并開(kāi)源了最新一代MoE架構(gòu)大模型MiMo-V2-Flash,該模型總參數(shù)規(guī)模達(dá)3090億,激活參數(shù)150億,在推理、編碼及智能體應(yīng)用場(chǎng)景中展現(xiàn)出顯著優(yōu)勢(shì)。模型支持混合思維模式,用戶可自由切換深度思考與即時(shí)響應(yīng)模式,并具備一鍵生成完整HTML網(wǎng)頁(yè)的能力,可與Claude Code、Cursor等主流編碼框架無(wú)縫協(xié)作。

在性能測(cè)試中,MiMo-V2-Flash與DeepSeek-V3.2形成直接競(jìng)爭(zhēng)態(tài)勢(shì)。基準(zhǔn)數(shù)據(jù)顯示,該模型在數(shù)學(xué)競(jìng)賽AIME 2025和科學(xué)知識(shí)GPQA-Diamond測(cè)試中位列開(kāi)源模型前二,軟件工程能力SWE驗(yàn)證及多語(yǔ)言測(cè)試中更超越所有開(kāi)源競(jìng)品,性能表現(xiàn)與全球頂尖閉源模型持平。特別在長(zhǎng)上下文處理方面,其性能已超越K2 Thinking模型,在SWE-Bench Verified測(cè)試中解決率達(dá)71.7%,BrowseComp搜索評(píng)估得分45.4,配合上下文管理后提升至58.3。

技術(shù)架構(gòu)層面,模型采用全局注意力(GA)與滑動(dòng)窗口注意力(SWA)的1:5混合結(jié)構(gòu),既保持了線性注意力的計(jì)算效率,又顯著提升了長(zhǎng)文本處理能力。創(chuàng)新引入的多詞元預(yù)測(cè)(MTP)訓(xùn)練技術(shù),通過(guò)同步生成多個(gè)候選token并并行驗(yàn)證的方式,使解碼吞吐量提升2-2.6倍。后訓(xùn)練階段采用的多教師在線策略蒸餾(MOPD)方法,僅需傳統(tǒng)方法1/50的計(jì)算資源即可達(dá)成同等優(yōu)化效果,形成"教學(xué)-學(xué)習(xí)"閉環(huán)迭代機(jī)制。

實(shí)際場(chǎng)景測(cè)試驗(yàn)證了模型的多樣化能力:在網(wǎng)頁(yè)開(kāi)發(fā)任務(wù)中,可生成包含商品輪播、規(guī)格選擇等功能的電商頁(yè)面,以及支持手勢(shì)交互的3D圣誕樹(shù)應(yīng)用;在創(chuàng)意生成方面,能創(chuàng)作憂郁愛(ài)情故事和非虛構(gòu)社會(huì)觀察作品;智能體交互測(cè)試中,既可解答"是否服用長(zhǎng)生不老藥"等哲學(xué)問(wèn)題,也能編寫(xiě)科幻懸疑劇本。不過(guò)實(shí)測(cè)發(fā)現(xiàn),部分復(fù)雜交互場(chǎng)景(如教育類太陽(yáng)系探索器)仍存在穩(wěn)定性問(wèn)題,需多次生成才能達(dá)到預(yù)期效果。

該模型已實(shí)現(xiàn)全面開(kāi)源,推理代碼完整貢獻(xiàn)至開(kāi)發(fā)者社區(qū)SGLang,API服務(wù)開(kāi)啟限時(shí)免費(fèi)體驗(yàn)。技術(shù)文檔顯示,在Prefill單機(jī)吞吐50000 toks/s條件下,16K上下文長(zhǎng)度的解碼吞吐量達(dá)5000-15000 toks/s,單請(qǐng)求吞吐量151-115 toks/s。價(jià)格策略方面,輸入token單價(jià)0.7元/百萬(wàn),輸出token單價(jià)2.1元/百萬(wàn),顯著低于行業(yè)平均水平。

此次發(fā)布標(biāo)志著小米大模型研發(fā)進(jìn)入快車(chē)道。集團(tuán)近期宣布將AI與現(xiàn)實(shí)世界深度結(jié)合列為未來(lái)十年核心戰(zhàn)略,AI業(yè)務(wù)投入連續(xù)四個(gè)季度環(huán)比增長(zhǎng)超50%。為加速技術(shù)突破,小米同步啟動(dòng)全球人才招募計(jì)劃,設(shè)立千萬(wàn)元級(jí)崗位薪酬,重點(diǎn)引進(jìn)大模型領(lǐng)域頂尖人才。技術(shù)團(tuán)隊(duì)近三個(gè)月已密集發(fā)布多篇學(xué)術(shù)論文,并陸續(xù)開(kāi)源多個(gè)預(yù)訓(xùn)練模型,構(gòu)建起完整的技術(shù)生態(tài)體系。

 
 
更多>同類內(nèi)容
推薦圖文
推薦內(nèi)容
點(diǎn)擊排行
 
智快科技微信賬號(hào)
ITBear微信賬號(hào)

微信掃一掃
加微信拉群
電動(dòng)汽車(chē)群
科技數(shù)碼群