谷歌公司正式發(fā)布新一代開源人工智能模型Gemma 4,宣稱該模型在智能體構(gòu)建與復(fù)雜推理任務(wù)中實(shí)現(xiàn)突破性進(jìn)展。這款基于Gemini 3技術(shù)架構(gòu)開發(fā)的模型,通過優(yōu)化商業(yè)應(yīng)用授權(quán)條款,成為當(dāng)前同規(guī)模開源模型中功能最全面的解決方案。
技術(shù)團(tuán)隊(duì)透露,Gemma 4構(gòu)建于超過140種語言構(gòu)成的訓(xùn)練數(shù)據(jù)集,重點(diǎn)強(qiáng)化了多步驟決策規(guī)劃與邏輯鏈推演能力。在代碼生成場(chǎng)景中,模型展現(xiàn)出對(duì)編程語法結(jié)構(gòu)的深度理解,能夠自動(dòng)完成函數(shù)調(diào)用鏈設(shè)計(jì)與異常處理機(jī)制搭建。針對(duì)智能體開發(fā)需求,研發(fā)人員特別優(yōu)化了環(huán)境感知模塊與任務(wù)分解算法,使虛擬助手可自主拆解復(fù)雜指令并協(xié)調(diào)多工具協(xié)同工作。
為適應(yīng)多樣化硬件環(huán)境,此次發(fā)布包含四個(gè)參數(shù)規(guī)模的版本矩陣。旗艦版模型配備280億參數(shù),在配備NVIDIA RTX 4090顯卡的個(gè)人電腦上即可實(shí)現(xiàn)每秒35 tokens的推理速度,滿足本地化部署需求。針對(duì)移動(dòng)端場(chǎng)景開發(fā)的輕量版僅含7億參數(shù),通過模型蒸餾技術(shù)將內(nèi)存占用壓縮至1.2GB,支持在搭載驍龍8 Gen3芯片的智能手機(jī)上實(shí)時(shí)運(yùn)行圖像描述生成任務(wù)。
商業(yè)應(yīng)用層面,谷歌開放了完整的模型微調(diào)接口與量化壓縮工具包。開發(fā)者可通過差異化的參數(shù)調(diào)整策略,在醫(yī)療診斷、金融分析等垂直領(lǐng)域構(gòu)建專業(yè)模型。值得注意的是,新模型采用改進(jìn)的注意力機(jī)制架構(gòu),在處理長(zhǎng)文本時(shí)可將上下文窗口擴(kuò)展至128K tokens,較前代產(chǎn)品提升300%,顯著增強(qiáng)法律文書分析與科研論文解讀等任務(wù)的處理能力。















