作為AI芯片和計算系統(tǒng)的主要供應(yīng)商,,英偉達已躍升為全球市值最高的上市半導體公司,。近日英偉達CEO在COMPUTEX大會上更是接連甩出了多項重磅新品,包括GH200超級芯片,、大內(nèi)存生成式AI超級計算機DGX GH200……
GH200超級芯片
其中,,Grace Hopper超級芯片GH200已經(jīng)全面投產(chǎn)。這些芯片是英偉達新推出的DGX GH200人工智能超級計算平臺和 MGX 系統(tǒng)的核心組件,,它們專為處理海量的生成型人工智能任務(wù)而設(shè)計,。
GH200是英偉達開發(fā)的基于Arm架構(gòu)的CPU+GPU集成方案,它將72核的Grace CPU,、Hopper GPU,、96GB 的HBM3和512 GB的LPDDR5X集成在同一個封裝中,,共有2000億個晶體管。這種組合提供了CPU和GPU之間驚人的數(shù)據(jù)帶寬,,高達1TB /s,,為某些內(nèi)存受限的工作負載提供了巨大的優(yōu)勢。
DGX GH200超級計算機
DGX GH200人工智能超級計算機則集成了英偉達最先進加速計算和網(wǎng)絡(luò)技術(shù),。
這款超算專為大規(guī)模生成式AI的負載所設(shè)計,,由256塊GH200超級芯片組成,擁有1 exaflop超凡AI性能,、144TB內(nèi)存(是英偉達目前DGX A100系統(tǒng)的近500倍),、150英里光纖、2000多個風扇,。
預(yù)計DGX GH200將于今年年底投入問世,,英偉達暫未公布價格,而谷歌云,、Meta與微軟將是首批用戶,。
同時,英偉達也正在打造自家基于DGX GH200的大型AI超級計算機NVIDIA Helios,,以支持其研究和開發(fā)團隊的工作,。其中采用4個DGX GH200系統(tǒng)、1024顆Grace Hopper超級芯片,,每個都將與英偉達Quantum-2 InfiniBand網(wǎng)絡(luò)連接,,帶寬高達400Gb/s,將于今年年底上線,。
CPU成本,、功耗、處理數(shù)據(jù)量不如GPU
在本次大會上,,英偉達CEO還以數(shù)據(jù)中心成本架構(gòu)比較,,直言以GPU建置的數(shù)據(jù)中心將遠低于 CPU,強調(diào)買越多,、省越多 (The more you buy, the more you save.),。
英偉達CEO指出,盡管CPU過去幾年指令周期不斷提升,,但進入AI時代后,,以CPU為運算基礎(chǔ)的時代已經(jīng)結(jié)束,現(xiàn)在大型語言模型 (LLM) 需要更新的解決方案,。
假設(shè)建置數(shù)據(jù)中心預(yù)算為 1000萬美元,,可以選擇建置1座搭載 960顆CPU、功耗達 11GW 的數(shù)據(jù)中心,抑或是選擇建置 1 座有 48 顆 GPU,、功耗僅需 3.2GW 的數(shù)據(jù)中心,,且 LLM 數(shù)據(jù)處理量是 CPU 的 44 倍。
若以處理同樣數(shù)據(jù)量的大型語言模型 (LLM) 來看,,可以選擇斥資 1000 萬美元,,建置 1 座搭載 960 顆 CPU、功耗達 11GW 的數(shù)據(jù)中心,,抑或是選擇只花費 40 萬美元,,建置 1 臺需要 2 顆 GPU、功耗僅需 0.13GW 的數(shù)據(jù)中心,。
5月25日,,英偉達公布了明顯高于華爾街預(yù)期的季度營收預(yù)測,此后該公司股價在一天內(nèi)飆升24%,。季度報告表明,,營收的上漲主要受惠于云計算平臺和大型科技公司對GPU芯片的需求。