AMD重磅發布CDNA4架構及MI350系列AI GPU:性能4倍躍升
發布時間:2025-6-13 15:42
發布者:eechina
在今日召開的Advancing AI 2025峰會上,全球半導體巨頭AMD正式發布基于CDNA 4架構的Instinct MI350系列AI加速器,以“史上最大性能飛躍”向英偉達發起正面挑戰。新系列包含風冷版MI350X和液冷版MI355X兩款產品,搭載288GB HBM3E內存,FP4精度下算力達20.1 PFLOPS,推理性能較前代提升35倍,標志著AMD在AI算力競賽中邁出關鍵一步。![]() 核心突破:CDNA4架構重構AI計算范式 MI350系列基于臺積電第二代3nm(N3P)制程工藝,集成1850億個晶體管,采用Chiplet 3D混合封裝技術(XCD計算核心+IOD I/O核心),通過第四代Infinity Fabric總線實現5.5TB/s芯片間互聯。其核心創新包括: · 全精度計算引擎:首次支持FP4/FP6低精度格式,結合增強型矩陣計算引擎,在混合精度計算中性能提升2倍,DeepSeek-R1等大模型推理效率達英偉達H100的90%-120%。 · 內存帶寬巔峰:288GB HBM3E內存帶寬達8TB/s,較前代MI325X提升33%,可承載萬億參數大模型,700億參數模型推理延遲降至毫秒級。 · 能效比優化:通過架構改進與制程升級,MI350X在維持1000W TDP(熱設計功耗)下實現38倍能效提升,液冷版MI355X峰值功耗1400W,較前代翻倍但性能提升4倍。 市場對標:直擊英偉達軟肋,生態布局補位 AMD CEO蘇姿豐在發布會上直面與英偉達的競爭:“MI355X在FP4精度下生成Token的速度比英偉達B200快20%-30%,每美元投資可多生成40%的Token!边@一表態直指英偉達Hopper架構在能效比上的短板。 市場數據顯示,MI350系列已獲得頭部云服務商青睞: Meta、微軟、甲骨文已在生產環境部署MI300X,MI350將延續這一合作關系; OpenAI CEO山姆·阿爾特曼現身捧場,表示期待MI400(2026年發布)的更強性能; 戴爾、惠普、超微正研發支持8卡至128卡液冷互聯的機架級方案,劍指超大規模AI訓練集群。 戰略布局:從芯片到全棧的AI野心 AMD此次發布會不僅推出硬件,更構建了端到端AI基礎設施藍圖: 軟件生態:即將發布的ROCm 7軟件棧推理性能提升3.5倍,支持LLaMA、DeepSeek等主流模型開箱即用,180萬個Hugging Face模型已適配; 系統級創新: MI350X風冷機柜:8卡設計高度僅6U,HBM顯存容量18TB,FP8算力590 PFLOPS; MI355X液冷機柜:16卡設計顯存36TB,FP8算力1.28 EFLOPS,較前代密度提升117%; 網絡突破:聯合推出智能網卡Pensando Pollara 400,基于Ultra Ethernet標準,卸載GPU/CPU通訊負載,吞吐量較RoCEv2網卡提升10%-20%。 未來路線圖:MI400與Helios架構蓄勢待發 蘇姿豐在會后透露,下一代Instinct MI400將于2026年發布,搭載432GB HBM4內存,帶寬躍升至19.6TB/s,FP4算力預計達40 PFLOPS。配套的“Helios”AI機架式服務器將整合EPYC CPU、MI400 GPU和Pensando智能網卡,支持72顆GPU緊密耦合,縱向擴展帶寬達260TB/s。 |
網友評論