黄色三级不卡在线观看-男男视频网站高清观看-久久国产欧美韩国精品app-免费观看妇女A级视频-中文字幕一区二区三区人妻在线视频-国产精选av一区二区-欧美亚洲精品不卡一区二区-99女福利女女视频在线播放-国产美女香蕉久久精品

  • 虎科技 - 領(lǐng)先的互聯(lián)網(wǎng)科技媒體

云天勵(lì)飛“All in”大算力推理芯片,以GPNPU架構(gòu)開(kāi)啟AI普惠新征程

   時(shí)間:2026-02-04 11:00 來(lái)源:快訊作者:沈瑾瑜

在人工智能從“基礎(chǔ)模型構(gòu)建”向“規(guī)模化應(yīng)用落地”轉(zhuǎn)型的關(guān)鍵節(jié)點(diǎn),云天勵(lì)飛近日舉辦“大算力芯片戰(zhàn)略前瞻會(huì)”,正式公布未來(lái)三年大算力AI推理芯片的戰(zhàn)略布局。公司宣布將集中核心研發(fā)資源突破大模型落地的“成本壁壘”,通過(guò)底層架構(gòu)創(chuàng)新實(shí)現(xiàn)百萬(wàn)Tokens推理成本降低超100倍的目標(biāo),推動(dòng)AI技術(shù)從實(shí)驗(yàn)室走向普惠化生產(chǎn)場(chǎng)景。

全球算力產(chǎn)業(yè)重心正加速向推理側(cè)傾斜。谷歌2025年4月發(fā)布的第七代TPU“Ironwood”明確定位為“推理時(shí)代基石”,重點(diǎn)優(yōu)化大規(guī)模推理能效;英偉達(dá)同年12月斥資200億美元與推理芯片廠商Groq達(dá)成非獨(dú)占許可協(xié)議,吸納其核心團(tuán)隊(duì)強(qiáng)化實(shí)時(shí)工作負(fù)載能力。行業(yè)信號(hào)顯示,推理競(jìng)爭(zhēng)已從“參數(shù)規(guī)?!鞭D(zhuǎn)向“單位成本與交付效率”,能效比成為規(guī)?;涞氐暮诵拈T(mén)檻。

云天勵(lì)飛提出GPNPU技術(shù)路線,以“GPNPU = GPGPU + NPU + 3D堆疊存儲(chǔ)”公式重構(gòu)芯片架構(gòu)。該路線通過(guò)兼容CUDA生態(tài)實(shí)現(xiàn)一行代碼遷移,降低企業(yè)應(yīng)用門(mén)檻;采用NPU專用化設(shè)計(jì)提升能效比,針對(duì)大模型推理的結(jié)構(gòu)化負(fù)載優(yōu)化成本;研發(fā)3D堆疊存儲(chǔ)技術(shù)突破“內(nèi)存墻”瓶頸,降低推理時(shí)延。公司CTO李?lèi)?ài)軍強(qiáng)調(diào),架構(gòu)創(chuàng)新需兼顧通用性與專用性,在工程層面解決可遷移、可部署、可持續(xù)降本三大難題。

在產(chǎn)品化路徑上,云天勵(lì)飛推出“算力積木”架構(gòu),通過(guò)Chiplet技術(shù)實(shí)現(xiàn)算力模塊化擴(kuò)展,支持從邊緣設(shè)備到千卡集群的彈性部署。公司拒絕單純堆砌芯片參數(shù),轉(zhuǎn)而圍繞真實(shí)業(yè)務(wù)負(fù)載進(jìn)行系統(tǒng)級(jí)優(yōu)化,逐項(xiàng)擊穿推理鏈路中的成本與時(shí)延瓶頸。目前,其政企事業(yè)部已啟動(dòng)區(qū)域級(jí)“千卡集群”建設(shè),旨在樹(shù)立城市AI算力賦能標(biāo)桿。

支撐戰(zhàn)略落地的核心在于五大要素協(xié)同:技術(shù)層面,公司聚焦AI大算力推理芯片研發(fā);產(chǎn)能層面,其國(guó)產(chǎn)供應(yīng)鏈儲(chǔ)備為大規(guī)模量產(chǎn)提供確定性;生態(tài)層面,四大事業(yè)部覆蓋研發(fā)、優(yōu)化到推廣的全鏈條;市場(chǎng)層面,政企事業(yè)部主導(dǎo)推理設(shè)備與智算中心建設(shè);資本層面,市值突破萬(wàn)億元的愿景彰顯長(zhǎng)期信心。董事長(zhǎng)陳寧特別指出,供應(yīng)鏈安全是當(dāng)前行業(yè)競(jìng)爭(zhēng)的關(guān)鍵變量,云天勵(lì)飛已構(gòu)建起抵御外部風(fēng)險(xiǎn)的護(hù)城河。

根據(jù)規(guī)劃,云天勵(lì)飛未來(lái)三年將梯度推進(jìn)DeepVerse芯片研發(fā),對(duì)標(biāo)國(guó)際主流平臺(tái)優(yōu)化長(zhǎng)上下文預(yù)填充、低時(shí)延解碼等關(guān)鍵環(huán)節(jié)。2028年產(chǎn)品將采用PD分離、AFN分離及超節(jié)點(diǎn)架構(gòu)設(shè)計(jì),性能指標(biāo)有望比肩英偉達(dá)Rubin架構(gòu)。公司強(qiáng)調(diào),推理時(shí)代的競(jìng)爭(zhēng)本質(zhì)是“單位推理成本”之爭(zhēng),唯有將技術(shù)做得足夠便宜、穩(wěn)定、易用,才能推動(dòng)AI從“能力展示”轉(zhuǎn)向“生產(chǎn)力工具”。

 
 
更多>同類(lèi)內(nèi)容
推薦圖文
推薦內(nèi)容
點(diǎn)擊排行
 
智快科技微信賬號(hào)
ITBear微信賬號(hào)

微信掃一掃
加微信拉群
電動(dòng)汽車(chē)群
科技數(shù)碼群