亚洲免费视频区一区二,国产精品亚洲一区二区三区在线

亞馬遜發(fā)布Trainium3芯片及UltraServer，性能飆升，成本大降賦能AI新發(fā)展

時(shí)間：2025-12-03 15:56 來源：快訊作者：鐘景軒

在近日舉辦的全球云計(jì)算領(lǐng)域年度盛會中，亞馬遜云計(jì)算服務(wù)（AWS）正式推出新一代自研AI訓(xùn)練芯片Trainium3，并同步發(fā)布基于該芯片的Trainium3 UltraServer服務(wù)器。這款硬件組合通過架構(gòu)革新與工藝升級，為生成式AI模型的訓(xùn)練與推理提供全新解決方案，標(biāo)志著AWS在垂直整合計(jì)算資源領(lǐng)域邁出關(guān)鍵一步。

據(jù)技術(shù)披露，Trainium3芯片采用臺積電3納米制程工藝，單芯片集成144GB HBM3E內(nèi)存，內(nèi)存帶寬達(dá)4.9TB/s，在FP8精度下可提供2.52 PFLOPS算力。其性能較前代產(chǎn)品實(shí)現(xiàn)四倍躍升，能效比與內(nèi)存帶寬同樣獲得近四倍優(yōu)化。通過新一代Neuron網(wǎng)絡(luò)架構(gòu)，芯片間通信延遲被壓縮至10微秒以內(nèi)，配合NeuronSwitch-v1實(shí)現(xiàn)的雙倍內(nèi)部帶寬，有效解決了分布式訓(xùn)練中的通信瓶頸問題。

UltraServer服務(wù)器將硬件集成度推向新高度。單臺設(shè)備最多可容納144顆Trainium3芯片，形成20.7TB HBM3E內(nèi)存池與706TB/s總帶寬的超級計(jì)算單元，F(xiàn)P8算力峰值達(dá)362 PFLOPS。實(shí)測數(shù)據(jù)顯示，該系統(tǒng)運(yùn)行GPT-OSS開源模型時(shí)，單芯片吞吐量提升300%，推理響應(yīng)速度加快4倍，顯著降低企業(yè)應(yīng)對流量峰值的硬件投入成本。目前Amazon Bedrock服務(wù)已率先在生產(chǎn)環(huán)境部署該硬件。

在應(yīng)用場景方面，這套硬件組合展現(xiàn)出顯著優(yōu)勢。對于千億參數(shù)級模型訓(xùn)練，其可將周期從數(shù)月壓縮至數(shù)周；面對智能對話、視頻生成等高并發(fā)推理需求，能以微秒級延遲服務(wù)百萬級用戶。多家合作伙伴已驗(yàn)證其成本效益：Decart公司借助Trainium架構(gòu)將實(shí)時(shí)視頻生成速度提升4倍，同時(shí)將單位推理成本削減50%；生物科技企業(yè)metagenomi則通過硬件優(yōu)化將基因序列分析效率提升3.5倍。

為滿足超大規(guī)模計(jì)算需求，AWS同步推出EC2 UltraCluster 3.0架構(gòu)。該集群通過高速互聯(lián)技術(shù)可連接數(shù)千臺UltraServer，形成百萬級芯片計(jì)算矩陣，較上一代規(guī)模擴(kuò)大十倍。這種擴(kuò)展能力使得在萬億token數(shù)據(jù)集上訓(xùn)練多模態(tài)模型成為可能，同時(shí)可為千萬級用戶提供實(shí)時(shí)推理服務(wù)，為自動駕駛、氣候模擬等前沿領(lǐng)域提供基礎(chǔ)設(shè)施支撐。

市場布局方面，AWS正面臨雙重挑戰(zhàn)。一方面需應(yīng)對谷歌TPU在AI芯片市場的持續(xù)滲透，特別是Anthropic等戰(zhàn)略客戶近期宣布將采購百萬級谷歌芯片；另一方面要鞏固與現(xiàn)有合作伙伴的關(guān)系——該生成式AI公司仍計(jì)劃年底前部署超百萬顆Trainium2芯片，其中近半數(shù)將運(yùn)行于Project Rainier超級計(jì)算機(jī)。為保持競爭力，AWS同步披露下一代Trainium4研發(fā)進(jìn)展，新芯片在FP4精度下性能將提升六倍，F(xiàn)P8性能提升三倍，并首次引入NVIDIA NVLink Fusion技術(shù)實(shí)現(xiàn)異構(gòu)計(jì)算協(xié)同。

這項(xiàng)技術(shù)整合計(jì)劃引發(fā)行業(yè)關(guān)注。通過將Trainium4與Graviton處理器、EFA網(wǎng)絡(luò)適配器部署在統(tǒng)一MGX機(jī)架，AWS旨在構(gòu)建兼具成本優(yōu)勢與性能彈性的AI基礎(chǔ)設(shè)施。這種模塊化設(shè)計(jì)既支持純CPU計(jì)算場景，也可靈活擴(kuò)展GPU與Trainium混合架構(gòu)，為不同規(guī)模的AI工作負(fù)載提供定制化解決方案。隨著軟硬件協(xié)同優(yōu)化的持續(xù)推進(jìn)，AI訓(xùn)練與推理的成本門檻有望進(jìn)一步降低。

更多>同類內(nèi)容

入華31年，艾格關(guān)閉線上店，內(nèi)衣業(yè)務(wù)退場或	AI技術(shù)平權(quán)時(shí)代：普通人用一句話“搓”出生
49.9元眉筆牽手高端絲芙蘭：是美妝寒冬下的	鴻蒙生態(tài)創(chuàng)新開放能力論壇：一站式賦能開發(fā)

亞馬遜發(fā)布Trainium3芯片及UltraServer，性能飆升，成本大降賦能AI新發(fā)展

亞馬遜發(fā)布Trainium3芯片及UltraServer，性能飆升，成本大降賦能AI新發(fā)展