谷歌首席執(zhí)行官桑達(dá)爾·皮查伊近日宣布,公司人工智能模型處理能力實(shí)現(xiàn)顯著躍升。通過直接調(diào)用應(yīng)用程序接口(API)的客戶使用模式,當(dāng)前每分鐘可處理超過160億個(gè)詞元(tokens),較上季度100億的處理量增長(zhǎng)60%。這一數(shù)據(jù)直觀反映出谷歌在生成式人工智能領(lǐng)域的持續(xù)投入正轉(zhuǎn)化為實(shí)際算力突破。
在最新舉辦的Google Cloud Next開發(fā)者大會(huì)上,谷歌正式推出第八代張量處理單元(TPU)系列芯片。其中TPU 8t與TPU 8i兩款新型號(hào)專為智能體(Agent)開發(fā)設(shè)計(jì),通過優(yōu)化內(nèi)存架構(gòu)與計(jì)算單元布局,可高效應(yīng)對(duì)動(dòng)態(tài)變化的模型參數(shù)需求。技術(shù)文檔顯示,新芯片在處理多模態(tài)數(shù)據(jù)流時(shí),能效比前代產(chǎn)品提升40%以上。
據(jù)內(nèi)部預(yù)測(cè),到2026年谷歌在機(jī)器學(xué)習(xí)領(lǐng)域的硬件投資將呈現(xiàn)結(jié)構(gòu)性轉(zhuǎn)變,超過半數(shù)資金將集中于云業(yè)務(wù)基礎(chǔ)設(shè)施。這一戰(zhàn)略調(diào)整與當(dāng)前企業(yè)級(jí)人工智能應(yīng)用需求激增密切相關(guān),特別是需要實(shí)時(shí)處理海量數(shù)據(jù)的智能客服、自動(dòng)化決策等場(chǎng)景,對(duì)底層算力提出更高要求。
谷歌云平臺(tái)同步升級(jí)的配套服務(wù)顯示,其正著力構(gòu)建從芯片到算法的全棧解決方案。新發(fā)布的芯片組支持從千億參數(shù)到萬億參數(shù)級(jí)模型的分布式訓(xùn)練,配合優(yōu)化的冷卻系統(tǒng)與供電架構(gòu),單集群可部署超過10萬張加速卡。這種硬件層面的突破為開發(fā)更復(fù)雜的認(rèn)知智能系統(tǒng)奠定了基礎(chǔ)。















