傳聞輝達 AI 晶片過熱,推遲 Blackwell 釋出
發佈時間:2024/11/19
為什麼重要
輝達 Blackwell 晶片的過熱問題將直接影響資料中心的啟用和運營進度,進而影響雲服務供應商的服務能力。
此問題還可能導致輝達的產品開發週期延遲,影響公司的長期收入預期和市場競爭力。
背景故事
#過熱問題、#機架設計、#開發週期延遲
傳聞輝達已要求供應商改變機架設計以解決過熱問題,但問題未得到徹底解決。NVL72 伺服器機架設計中的過熱問題導致效能下降,NVL72 是連線 72 臺 GB200 的伺服器機架。
輝達的 AI GPU 開發週期從 Ampere 開始的「2 年開發週期」將因 Blackwell 延遲而中斷,輝達已將 Blackwell 晶片的發布日期從原計劃的 2024 年 5 月推遲到 2025 年上半年末。
發生了什麼
#雲端服務合作、#晶片容量提升、#電力消耗
輝達發言人表示,公司正與頂尖雲端服務供應商合作,工程方面的調整「正常且符合預期」。英偉達預計在第四季度 Blackwell 晶片的營收將達到數十億美元,微軟 Azure 與谷歌雲已部署執行在 Blackwell 系列晶片上的伺服器。
Blackwell 的 B200 搭載 8 顆 24GB HBM3E,總容量達到 192GB,容量較前一代的 H200 搭載的 141GB 容量提升 36%。
GB200 每顆晶片消耗 1000 瓦特(1kW)電力,NVL72 總消耗約 120kW,相當於美國約 40 戶家庭的電力供應。
接下來如何
#銷售增長預期、#財報預期、#冷卻技術開發
輝達正在開發下一代烈冷系統,包括與合作夥伴 HPE 研究的 2 相(P2P)烈冷技術,以解決過熱問題並保持產品開發週期。
他們說什麼
輝達發言人表示:「公司正與頂尖雲端服務供應商合作,工程方面的調整正常且符合預期。」
輝達關係人指出:「高效能處理器的熱管理是 AI 計算發展的關鍵挑戰之一,我們正致力於透過技術創新解決這一問題。」
提到的股票
概念股
參考資料
編輯整理:Ryan Chen