黄色三级不卡在线观看-男男视频网站高清观看-久久国产欧美韩国精品app-免费观看妇女A级视频-中文字幕一区二区三区人妻在线视频-国产精选av一区二区-欧美亚洲精品不卡一区二区-99女福利女女视频在线播放-国产美女香蕉久久精品

  • 虎科技 - 領(lǐng)先的互聯(lián)網(wǎng)科技媒體

亞馬遜發(fā)布Trainium3芯片及UltraServer,性能飆升,成本大降賦能AI新發(fā)展

   時(shí)間:2025-12-03 15:56 來源:快訊作者:鐘景軒

在近日舉辦的全球云計(jì)算領(lǐng)域年度盛會中,亞馬遜云計(jì)算服務(wù)(AWS)正式推出新一代自研AI訓(xùn)練芯片Trainium3,并同步發(fā)布基于該芯片的Trainium3 UltraServer服務(wù)器。這款硬件組合通過架構(gòu)革新與工藝升級,為生成式AI模型的訓(xùn)練與推理提供全新解決方案,標(biāo)志著AWS在垂直整合計(jì)算資源領(lǐng)域邁出關(guān)鍵一步。

據(jù)技術(shù)披露,Trainium3芯片采用臺積電3納米制程工藝,單芯片集成144GB HBM3E內(nèi)存,內(nèi)存帶寬達(dá)4.9TB/s,在FP8精度下可提供2.52 PFLOPS算力。其性能較前代產(chǎn)品實(shí)現(xiàn)四倍躍升,能效比與內(nèi)存帶寬同樣獲得近四倍優(yōu)化。通過新一代Neuron網(wǎng)絡(luò)架構(gòu),芯片間通信延遲被壓縮至10微秒以內(nèi),配合NeuronSwitch-v1實(shí)現(xiàn)的雙倍內(nèi)部帶寬,有效解決了分布式訓(xùn)練中的通信瓶頸問題。

UltraServer服務(wù)器將硬件集成度推向新高度。單臺設(shè)備最多可容納144顆Trainium3芯片,形成20.7TB HBM3E內(nèi)存池與706TB/s總帶寬的超級計(jì)算單元,F(xiàn)P8算力峰值達(dá)362 PFLOPS。實(shí)測數(shù)據(jù)顯示,該系統(tǒng)運(yùn)行GPT-OSS開源模型時(shí),單芯片吞吐量提升300%,推理響應(yīng)速度加快4倍,顯著降低企業(yè)應(yīng)對流量峰值的硬件投入成本。目前Amazon Bedrock服務(wù)已率先在生產(chǎn)環(huán)境部署該硬件。

在應(yīng)用場景方面,這套硬件組合展現(xiàn)出顯著優(yōu)勢。對于千億參數(shù)級模型訓(xùn)練,其可將周期從數(shù)月壓縮至數(shù)周;面對智能對話、視頻生成等高并發(fā)推理需求,能以微秒級延遲服務(wù)百萬級用戶。多家合作伙伴已驗(yàn)證其成本效益:Decart公司借助Trainium架構(gòu)將實(shí)時(shí)視頻生成速度提升4倍,同時(shí)將單位推理成本削減50%;生物科技企業(yè)metagenomi則通過硬件優(yōu)化將基因序列分析效率提升3.5倍。

為滿足超大規(guī)模計(jì)算需求,AWS同步推出EC2 UltraCluster 3.0架構(gòu)。該集群通過高速互聯(lián)技術(shù)可連接數(shù)千臺UltraServer,形成百萬級芯片計(jì)算矩陣,較上一代規(guī)模擴(kuò)大十倍。這種擴(kuò)展能力使得在萬億token數(shù)據(jù)集上訓(xùn)練多模態(tài)模型成為可能,同時(shí)可為千萬級用戶提供實(shí)時(shí)推理服務(wù),為自動駕駛、氣候模擬等前沿領(lǐng)域提供基礎(chǔ)設(shè)施支撐。

市場布局方面,AWS正面臨雙重挑戰(zhàn)。一方面需應(yīng)對谷歌TPU在AI芯片市場的持續(xù)滲透,特別是Anthropic等戰(zhàn)略客戶近期宣布將采購百萬級谷歌芯片;另一方面要鞏固與現(xiàn)有合作伙伴的關(guān)系——該生成式AI公司仍計(jì)劃年底前部署超百萬顆Trainium2芯片,其中近半數(shù)將運(yùn)行于Project Rainier超級計(jì)算機(jī)。為保持競爭力,AWS同步披露下一代Trainium4研發(fā)進(jìn)展,新芯片在FP4精度下性能將提升六倍,F(xiàn)P8性能提升三倍,并首次引入NVIDIA NVLink Fusion技術(shù)實(shí)現(xiàn)異構(gòu)計(jì)算協(xié)同。

這項(xiàng)技術(shù)整合計(jì)劃引發(fā)行業(yè)關(guān)注。通過將Trainium4與Graviton處理器、EFA網(wǎng)絡(luò)適配器部署在統(tǒng)一MGX機(jī)架,AWS旨在構(gòu)建兼具成本優(yōu)勢與性能彈性的AI基礎(chǔ)設(shè)施。這種模塊化設(shè)計(jì)既支持純CPU計(jì)算場景,也可靈活擴(kuò)展GPU與Trainium混合架構(gòu),為不同規(guī)模的AI工作負(fù)載提供定制化解決方案。隨著軟硬件協(xié)同優(yōu)化的持續(xù)推進(jìn),AI訓(xùn)練與推理的成本門檻有望進(jìn)一步降低。

 
 
更多>同類內(nèi)容
推薦圖文
推薦內(nèi)容
點(diǎn)擊排行
 
智快科技微信賬號
ITBear微信賬號

微信掃一掃
加微信拉群
電動汽車群
科技數(shù)碼群