黄色三级不卡在线观看-男男视频网站高清观看-久久国产欧美韩国精品app-免费观看妇女A级视频-中文字幕一区二区三区人妻在线视频-国产精选av一区二区-欧美亚洲精品不卡一区二区-99女福利女女视频在线播放-国产美女香蕉久久精品

  • 虎科技 - 領(lǐng)先的互聯(lián)網(wǎng)科技媒體

英偉達新動作引關(guān)注:國內(nèi)AI創(chuàng)新路徑或重塑GPU編程新格局

   時間:2026-01-13 09:51 來源:快訊作者:沈瑾瑜

英偉達在GPU硬件與CUDA軟件生態(tài)領(lǐng)域長期占據(jù)主導(dǎo)地位,其GPU算力與CUDA編程框架的組合,幾乎成為AI開發(fā)領(lǐng)域的“標配”。然而,近期英偉達推出的一項新技術(shù),卻引發(fā)了行業(yè)對GPU編程格局變化的廣泛討論——這項被稱為CUDA Tile的新語言,被指借鑒了中國團隊的創(chuàng)新思路。

事件起因于2024年初,中國團隊開發(fā)了一款名為TileLang的GPU編程語言,其設(shè)計理念與CUDA Tile高度相似。更引人注目的是,AI模型開發(fā)公司DeepSeek在發(fā)布V3.2版本時,同步推出了基于CUDA和TileLang的雙版本模型。此前,DeepSeek的模型深度依賴英偉達CUDA生態(tài),甚至部分代碼直接使用英偉達專有的PTX匯編語言優(yōu)化算力。而TileLang的出現(xiàn),使得其模型能夠輕松部署在華為昇騰等國產(chǎn)AI芯片上,打破了硬件綁定的局限。

這一系列動作引發(fā)了行業(yè)猜測:英偉達是否因感受到中國技術(shù)的威脅,才緊急推出CUDA Tile?盡管英偉達官方將此次更新描述為“自2006年CUDA發(fā)布以來最大的進步”,但時間上的巧合仍讓人浮想聯(lián)翩。

CUDA的局限性在AI時代逐漸顯現(xiàn)。傳統(tǒng)GPU編程依賴SIMT(單指令多線程)機制,通過統(tǒng)一指令控制大量線程并行執(zhí)行。這種模式在圖形渲染等任務(wù)中效率極高,例如處理游戲畫面時,GPU可同時對數(shù)百萬像素執(zhí)行相同操作。但在AI推理中,計算步驟往往依賴前序結(jié)果,線程間需頻繁同步,導(dǎo)致“快的等慢的”現(xiàn)象,嚴重浪費算力。CUDA模型不重視數(shù)據(jù)復(fù)用,中間結(jié)果需反復(fù)寫入全局內(nèi)存,進一步降低效率。

為應(yīng)對這些問題,英偉達早在2014年推出cuDNN庫,將卷積、矩陣乘法等常用AI算子封裝為“預(yù)制菜”,供開發(fā)者直接調(diào)用。然而,cuDNN的封閉性限制了其靈活性——一旦模型涉及新算子,開發(fā)者仍需手動編寫CUDA代碼,重新處理線程調(diào)度、內(nèi)存管理等底層細節(jié)。這種“手搓代碼”的模式不僅開發(fā)效率低下,還容易因優(yōu)化不足導(dǎo)致性能損失。

TileLang的創(chuàng)新在于,它徹底改變了開發(fā)者與GPU的交互方式。開發(fā)者只需定義計算邏輯和數(shù)據(jù)流向,線程分配、數(shù)據(jù)復(fù)用、同步時機等復(fù)雜任務(wù)均由編譯器自動完成。例如,在開發(fā)MLA算子時,TileLang可將代碼量從CUDA/C++的500余行壓縮至80行,同時性能提升30%。這種“高層次抽象”的設(shè)計,使得即使是沒有GPU編程經(jīng)驗的開發(fā)者,也能快速實現(xiàn)高效算子開發(fā)。

面對TileLang的挑戰(zhàn),英偉達選擇主動出擊。2024年12月,英偉達正式推出CUDA Tile,其核心功能與TileLang高度重合:通過自動化線程管理和數(shù)據(jù)優(yōu)化,降低AI算子開發(fā)門檻。作為英偉達官方工具,CUDA Tile能夠直接調(diào)用GPU底層資源,在性能優(yōu)化和工具鏈支持上具備天然優(yōu)勢。對于依賴英偉達生態(tài)的開發(fā)者而言,CUDA Tile無疑是更穩(wěn)妥的選擇。

然而,TileLang的價值在于其開放性。傳統(tǒng)GPU開發(fā)中,代碼與硬件深度綁定,更換平臺需重寫大量底層邏輯。而TileLang通過抽象化硬件細節(jié),使同一套代碼可在不同廠商的GPU、TPU甚至國產(chǎn)AI芯片上運行。這種“一次編寫,多處部署”的特性,正逐漸改變開發(fā)者對硬件生態(tài)的依賴邏輯——未來,選擇GPU的標準可能從“CUDA生態(tài)是否成熟”轉(zhuǎn)變?yōu)椤按a能否跨平臺兼容”。

類似的故事在其他領(lǐng)域早已上演。例如,游戲開發(fā)中,盡管DirectX 12與Windows深度綁定且性能極致,但跨平臺的Vulkan仍憑借開放性分走了部分市場份額。開發(fā)者用行動證明:性能并非唯一標準,避免被單一廠商技術(shù)路線“卡脖子”,同樣是重要的考量因素。

 
 
更多>同類內(nèi)容
推薦圖文
推薦內(nèi)容
點擊排行
 
智快科技微信賬號
ITBear微信賬號

微信掃一掃
加微信拉群
電動汽車群
科技數(shù)碼群