黄色三级不卡在线观看-男男视频网站高清观看-久久国产欧美韩国精品app-免费观看妇女A级视频-中文字幕一区二区三区人妻在线视频-国产精选av一区二区-欧美亚洲精品不卡一区二区-99女福利女女视频在线播放-国产美女香蕉久久精品

  • 虎科技 - 領(lǐng)先的互聯(lián)網(wǎng)科技媒體

寒序科技亮劍推理芯片賽道:北大系黑馬挑戰(zhàn)巨頭,目標(biāo)2000 Tokens每秒

   時(shí)間:2026-03-11 01:26 來源:快訊作者:沈瑾瑜

當(dāng)英偉達(dá)被傳以200億美元估值“招安”北美推理芯片明星企業(yè)Groq時(shí),一場關(guān)于AI算力格局的變革正在悄然醞釀。而在太平洋彼岸,一家脫胎于北京大學(xué)的創(chuàng)業(yè)團(tuán)隊(duì)——寒序科技,正以“非共識”技術(shù)路線向行業(yè)拋出重磅炸彈:其首顆超大帶寬流式推理芯片完成流片測試,單位面積帶寬突破100 GB/s/mm2,下一代“MRAM+SRAM”混合架構(gòu)更將目標(biāo)直指2000 Tokens/s的推理速度極限。

這場技術(shù)突圍戰(zhàn)的核心,直指傳統(tǒng)GPU架構(gòu)的“阿喀琉斯之踵”——內(nèi)存墻?,F(xiàn)代GPU為兼容通用計(jì)算,設(shè)計(jì)了復(fù)雜的多級緩存和動態(tài)調(diào)度機(jī)制,在訓(xùn)練階段通過數(shù)據(jù)并行展現(xiàn)統(tǒng)治力,卻在推理場景中陷入“高射炮打蚊子”的困境。以生成Token為例,每個(gè)步驟依賴的矩陣向量乘運(yùn)算(GEMV)本質(zhì)是帶寬受限型任務(wù),而GPU的浮點(diǎn)運(yùn)算單元常因等待顯存數(shù)據(jù)搬運(yùn)而閑置,導(dǎo)致算力利用率不足30%。

寒序科技的解決方案堪稱“暴力美學(xué)”:徹底摒棄硬件調(diào)度邏輯,采用片上存儲權(quán)重的流式架構(gòu)。其芯片內(nèi)部被劃分為三大功能模塊——高密度權(quán)重存儲區(qū)、GEMV計(jì)算陣列、向量運(yùn)算單元,數(shù)據(jù)流動路徑嚴(yán)格遵循神經(jīng)網(wǎng)絡(luò)前向傳播的確定性規(guī)則。這種“生產(chǎn)線模式”設(shè)計(jì)使每個(gè)納秒的數(shù)據(jù)位置均可預(yù)判,消除動態(tài)資源爭搶帶來的延遲抖動,將帶寬利用率推至理論極限。

流片測試數(shù)據(jù)印證了技術(shù)路線的顛覆性。在40nm制程下,寒序首顆芯片實(shí)現(xiàn)單位面積帶寬100 GB/s/mm2,較傳統(tǒng)HBM3e方案提升3倍以上,較Groq同類架構(gòu)密度提升40%。這意味著在相同芯片尺寸下,寒序方案可處理更大規(guī)模的模型參數(shù),或以更小功耗達(dá)成同等推理性能。對于需要毫秒級響應(yīng)的具身智能、實(shí)時(shí)同傳等場景,這種突破直接解決了“算力夠用但帶寬不夠”的行業(yè)痛點(diǎn)。

更令行業(yè)矚目的是其下一代混合存儲架構(gòu)。針對Groq純SRAM方案容量受限的缺陷,寒序創(chuàng)新性引入MRAM(磁性隨機(jī)存儲器)。這種新型非易失性存儲器兼具SRAM級速度與DRAM級密度,單芯片模型存儲容量較純SRAM方案提升10倍以上。通過動態(tài)分配MRAM存儲長程權(quán)重、SRAM緩存短程激活數(shù)據(jù),混合架構(gòu)在保持2000 Tokens/s極限速度的同時(shí),將單卡可運(yùn)行模型規(guī)模從70B擴(kuò)展至300B量級,為多智能體協(xié)同、復(fù)雜環(huán)境推理等場景提供算力基石。

技術(shù)突破的背后,是北大磁學(xué)中心十余年的底層研究積淀。團(tuán)隊(duì)在MRAM材料與存算一體架構(gòu)領(lǐng)域擁有60余項(xiàng)專利,其獨(dú)創(chuàng)的“磁電耦合寫入技術(shù)”使MRAM寫入能耗降低80%,突破了混合架構(gòu)落地的最后一道屏障。這種從材料到系統(tǒng)的垂直創(chuàng)新,使寒序成為全球少數(shù)掌握高密度MRAM集成能力的推理芯片企業(yè)。

資本市場的反應(yīng)印證了技術(shù)路線的價(jià)值。在完成數(shù)千萬元Pre-A輪融資后,寒序科技已啟動7nm制程芯片流片,預(yù)計(jì)2026年實(shí)現(xiàn)量產(chǎn)。投資方啟高資本表示:“當(dāng)行業(yè)還在爭論GPU與ASIC路線時(shí),寒序用確定性流式架構(gòu)重新定義了推理芯片的物理邊界,這種底層創(chuàng)新具有真正的范式革命意義?!?/p>

隨著AI Agent從實(shí)驗(yàn)室走向產(chǎn)業(yè)應(yīng)用,推理芯片的市場格局正在重構(gòu)。英偉達(dá)雖在GTC 2026前夕強(qiáng)化推理布局,但其基于GPU的改良方案仍受制于架構(gòu)慣性。而寒序科技代表的垂直創(chuàng)新者,正通過解構(gòu)計(jì)算本質(zhì)、重構(gòu)數(shù)據(jù)流動規(guī)則,在算力霸權(quán)時(shí)代撕開一道突破口。當(dāng)推理成為AGI落地的最后一公里,這場關(guān)于速度、密度與能效的戰(zhàn)爭,才剛剛拉開帷幕。

 
 
更多>同類內(nèi)容
推薦圖文
推薦內(nèi)容
點(diǎn)擊排行
 
智快科技微信賬號
ITBear微信賬號

微信掃一掃
加微信拉群
電動汽車群
科技數(shù)碼群