近年來,人工智能領(lǐng)域迎來重大突破,前沿模型在商業(yè)化應(yīng)用上取得顯著進(jìn)展。據(jù)權(quán)威機(jī)構(gòu)METR評估,Opus 4.6、Gemini 3.1等模型已具備持續(xù)獨(dú)立工作超過1小時(shí)的能力,在保持80%任務(wù)完成率的前提下無需人工干預(yù)。即將發(fā)布的Claude Mythos更將這一時(shí)長延長至3小時(shí)以上,標(biāo)志著AI模型從"輔助回答"向"自主完成任務(wù)"的轉(zhuǎn)型。
任務(wù)執(zhí)行時(shí)間的延長直接導(dǎo)致Token消耗量激增。企業(yè)衡量AI應(yīng)用規(guī)模的核心指標(biāo)已轉(zhuǎn)向Token使用量,算力資源隨之成為創(chuàng)造價(jià)值的關(guān)鍵生產(chǎn)要素。以海外廠商Anthropic為例,其預(yù)計(jì)2026年第二季度將實(shí)現(xiàn)單季度營業(yè)利潤轉(zhuǎn)正,經(jīng)營利潤達(dá)5.6億美元,年化營業(yè)收入(ARR)突破470億美元。這種變化使算力采購決策從"成本投入"轉(zhuǎn)變?yōu)榛谕顿Y回報(bào)率(ROI)的理性決策。
算力需求結(jié)構(gòu)的轉(zhuǎn)變正在重塑云服務(wù)市場格局。此前以模型訓(xùn)練為主的階段,英偉達(dá)GPU憑借絕對性能優(yōu)勢占據(jù)主導(dǎo)地位。但隨著推理場景成為主流,云廠商開始將關(guān)注點(diǎn)轉(zhuǎn)向單Token成本優(yōu)化。專用集成電路(ASIC)芯片在推理任務(wù)中展現(xiàn)出顯著優(yōu)勢,其單位計(jì)算成本較GPU降低30%以上,促使云廠商加速采購布局。行業(yè)預(yù)測顯示,2027年ASIC芯片出貨量將達(dá)1590萬片,市場份額超越GPU成為主流硬件類型。
臺積電先進(jìn)封裝產(chǎn)能的調(diào)整印證了這一趨勢。其CoWoS封裝工藝作為ASIC芯片的核心配套技術(shù),2027年產(chǎn)能預(yù)計(jì)同比增長87%至266.4萬片晶圓。其中,meta、谷歌、亞馬遜等云廠商自研芯片占用的產(chǎn)能份額將從2026年的28%提升至32%。這種轉(zhuǎn)變使云廠商在芯片租賃業(yè)務(wù)中獲得更高毛利率,亞馬遜Trainium 2和谷歌TPU v6的租賃毛利率均優(yōu)于同代GPU產(chǎn)品。
芯片設(shè)計(jì)市場正經(jīng)歷多元化變革。博通雖仍保持高端ASIC設(shè)計(jì)市場80%以上份額,但谷歌已通過拆分產(chǎn)品線降低依賴度——將第八代TPU分為訓(xùn)練專用的v8t和推理專用的v8i,后者交由聯(lián)發(fā)科設(shè)計(jì)。亞馬遜則通過世芯電子主導(dǎo)Trainium 3物理設(shè)計(jì),并增加直接采購芯片組件的流片項(xiàng)目。這種策略調(diào)整使云廠商在供應(yīng)鏈中掌握更多主動(dòng)權(quán),2026年第一季度谷歌云和亞馬遜AWS的業(yè)績增長即印證了這一轉(zhuǎn)型成效。
當(dāng)AI集群規(guī)模擴(kuò)展至數(shù)萬乃至百萬級芯片時(shí),芯片間通信效率成為制約計(jì)算效能的關(guān)鍵因素。谷歌在TPU v8i中引入的Boardfly拓?fù)浣Y(jié)構(gòu),通過板組間直接光纖鏈路將1024顆芯片集群的網(wǎng)絡(luò)直徑壓縮56%,有效解決通信密集型任務(wù)的尾部延遲問題。這種架構(gòu)創(chuàng)新使TPU與光路交換機(jī)(OCS)的配比從192:1提升至58:1,推動(dòng)光學(xué)互聯(lián)方案成為產(chǎn)業(yè)標(biāo)配。
產(chǎn)業(yè)鏈相關(guān)企業(yè)正迎來發(fā)展機(jī)遇。AI ASIC設(shè)計(jì)領(lǐng)域,寒武紀(jì)、海光信息等企業(yè)加速技術(shù)迭代;先進(jìn)封裝環(huán)節(jié),通富微電、長電科技等廠商擴(kuò)大CoWoS產(chǎn)能;高速互聯(lián)領(lǐng)域,中際旭創(chuàng)、新易盛的光模塊產(chǎn)品需求持續(xù)增長。這些企業(yè)的技術(shù)突破與產(chǎn)能擴(kuò)張,共同支撐著AI算力基礎(chǔ)設(shè)施的升級轉(zhuǎn)型。















