在AI行業蓬勃發展的當下,全球對Token的需求量呈爆發式增長,然而國內算力產業卻面臨諸多困境。海外高端GPU供應受限,采購門檻不斷抬高,國內AI企業長期面臨“一卡難求”的尷尬局面。同時,傳統2D芯片和HBM方案難以突破“內存墻”的束縛,數據反復搬運導致高額能耗與成本,許多國內芯片企業只能沿著海外GPU的成熟路線追趕,卻因先進制程和軟件生態的壁壘而進展艱難。
在這樣的背景下,算苗科技自2019年起便堅定地選擇了3D混合鍵合這條少有人走的路。團隊潛心鉆研,打磨了上萬片3D堆疊晶圓,克服了產業鏈不成熟、良率攻關等重重困難。當多數企業還在觀望3D技術的可行性時,算苗科技已逐步構建起國產供應鏈體系,走出了一條不依賴海外先進制程、區別于英偉達的全新3D TokenPU技術路徑,為國產算力提供了新的發展思路。
6月17日,算苗科技在北京舉辦媒體溝通會,宣布國內首顆面向大模型推理的3D TokenPU芯片A4E于6月15日成功流片。這一消息引起了廣泛關注,截至目前,這條突圍路線逐漸得到資本市場的認可,算苗科技已先后完成多輪融資,研發人員占比超過80%。今年7月,企業還將啟動新一輪融資,用于芯片迭代和高端人才擴充。
在溝通會上,算苗科技CEO汪福全與搜狐科技等媒體圍繞3D堆疊技術、國產算力突圍、量產商業化落地等話題展開了深入對話。當被問及A4E流片對國內AI算力行業的意義時,汪福全表示,這是國產云端大算力芯片的一次關鍵突破。過去,國內高端算力芯片受制于海外先進制程和HBM內存供貨,或者只能照搬傳統2D GPU架構,難以跨越“內存墻”。而A4E依托國產成熟制程和本土供應鏈體系完成3D混合堆疊流片,證明了不依賴頂尖先進制程,通過架構創新也能對標全球頂級云端AI芯片。
對于芯片的量產時間,汪福全透露,A4E剛剛流片,如果進度順利,明年同期就能實現規模量產。第二代A4S計劃明年春節前后流片,整體性能將實現翻倍提升。
在介紹算苗自研的TokenPU時,汪福全指出,GPU誕生于PC圖像游戲時代,雖是優秀的并行處理架構,但并非為大模型時代的海量Token處理量身打造,存在能耗高、成本高、可維護性差等問題。而市面上多數NPU主要針對手機終端等輕量化場景,無法承受云端海量推理負載。TokenPU則是大模型時代原生的計算架構,專為貼合AI大模型底層邏輯設計,對語言文本、圖片、視頻乃至未來世界模型等信息轉化為的Token運算進行了全鏈路優化。
針對行業長期認為英偉達CUDA生態是難以逾越的高墻這一觀點,汪福全認為,在GPU時代,軟件生態確實是英偉達的重要護城河,但如今行業底層邏輯已發生徹底變化。全球日均生成500至600萬億Token,每個Token背后都消耗著電力和算力,單位Token使用成本已成為客戶首要考量因素。3D堆疊能帶來顯著的能效優勢,大幅降低單Token運營成本。再加上海外高端GPU采購受限且存在斷供風險,國內模型企業主動擁抱國產算力的意愿增強,CUDA已不再是不可突破的壁壘,供應鏈穩定和極致性價比正在重新定義行業選擇標準。
當被問及3D堆疊技術直擊AI芯片什么痛點以及對比傳統技術路線的優勢時,汪福全解釋道,大模型參數規模不斷擴大,運算時數據在內存和計算單元之間反復搬運,形成了“內存墻”,芯片大半能耗和延遲都消耗在數據搬運上。傳統HBM采用2.5D封裝,GPU與HBM通過標準總線互聯。而3D混合鍵合直接將存儲晶圓垂直疊在邏輯芯片上方,傳輸距離從毫米級壓縮到微米級,互聯的bump與TSV數量達到上百萬個,是標準總線的上千倍,極大地改善了線寬與總線,釋放了帶寬、減少了傳輸延遲。
近期市場Token價格持續走高,對于3D TokenPU能否從根源壓低AI使用成本的問題,汪福全表示,Token漲價的核心原因是算力供給跟不上爆炸式需求,電力消耗是最大成本項。美國百萬Token成本約0.6美元,國內電價較低但使用人口多,算力缺口持續推高服務價格。目前,3D堆疊是唯一成熟且可大規模量產落地的降本路線,其他新技術離產業落地和量產還較遠。依托國內電力優勢,等A4E大規模出貨后,行業硬件和電力成本會下降。但如果Token需求增速持續超過算力擴容速度,價格仍有上漲可能。
面對不少企業扎堆布局3D芯片的情況,汪福全認為,國內已有一些企業入局3D設計,但從人才儲備、經驗積累、技術驗證和供應鏈磨合等方面來看,算苗科技的壁壘很難在短期內被復制。3D堆疊資金、人才、工程落地門檻極高,且研發周期長,不太可能出現惡性內卷。
在被問到國內先進制程存在短板,依靠3D堆疊架構創新,與海外高端芯片的技術代差未來三五年會如何時,汪福全稱,單純比拼先進制程,國內短期內確實存在差距,但3D堆疊是換道超車路線。海外廠商靠先進制程疊加HBM提高算力,而國內繞開制程短板,用立體堆疊提升訪存帶寬與算力密度。依靠國內芯片產業鏈的持續成熟和持續創新的架構,未來有能力解決算力饑渴問題。















