隨著全球科技巨頭陸續(xù)入局AI大模型,算力需求(特別是大模型和行業(yè)應用等方面)迅速增長,,GPU被全球哄搶,,漲價、缺貨不斷,。不過,,也因此帶火了英偉達在三月份提出的一項業(yè)務——算力租賃。
GPU有多搶手,?漲價50%,,訂單排到明年
據(jù)悉,,GPU不像消費顯卡,很多商家會有庫存,,本身存貨就很少,,整個供應鏈上的貨不超過三四千片,ChatGPT熱度起來以后,,存貨很快被互聯(lián)網(wǎng)大廠鎖定,,今年3月后市場上基本沒有存貨。部分大廠直接從國外渠道找一些貨回來,,如今50%以上的訂單基本都是互聯(lián)網(wǎng)大廠的,。
GPU的火爆不僅在現(xiàn)貨市場,連訂單都在搶著下,。
上海六尺科技集團創(chuàng)始人張亞洲表示:“微軟,、英特爾等海外大廠一邊自研、一邊也在對外采購,,前期訂的一部分(GPU訂單),,可能用于大規(guī)模訓練,但對于推理還是不夠,。如今基本上廠商低于一個億的訂單,,也許渠道商都不愿搭理,發(fā)郵件都不回,?!?/span>
價格方面,多款GPU價格從3,、4月到至今漲幅接近50%,。4月份訂單還能排到10月份,如今已排到明年上半年,。
價格暴漲,,訂單延后,那對于迫切需要GPU來訓練模型的企業(yè),,是否還有其他選擇,?在這一背景下,也帶火了更具性價比的模式——算力租賃
「算力租賃」需求興起
算力租賃,,顧名思義就是對算力進行出租,,是一種通過云計算服務提供商租用計算資源的模式,適用于各種大規(guī)模計算需求的場景,。企業(yè)用戶可以根據(jù)自己的需求租賃服務器或虛擬機實現(xiàn)大規(guī)模的計算任務,,而無需擁有自己的計算資源。
其優(yōu)勢包括:無需投入大量資金購買計算設備,、高效穩(wěn)定的計算服務,、靈活的擴容或縮減,,更好地滿足用戶的需求、非常靈活的計費方式,,可以根據(jù)實際使用情況進行計費,。
通過租賃計算資源,用戶可以快速地啟動項目,,使用穩(wěn)定高效的計算資源,,大大縮短了研發(fā)周期和成本。
英偉達推出算力租賃服務
有數(shù)據(jù)顯示,,ChatGPT需要7-8個算力500P的數(shù)據(jù)中心才能支撐運行,。對于微軟、谷歌,、百度這樣的巨頭而言,,算力成本顯然并不會成為障礙,但對于中小團隊來說,,如此巨大的成本幾乎就是一座不可逾越的大山,并不是每一家企業(yè)都有能力建設屬于自己的算力矩陣,。
因此,,英偉達就提出了算力租賃的模式。
今年3月,,英偉達CEO宣布了DGX Cloud算力租賃服務計劃,,讓企業(yè)用戶不需購買昂貴的AI服務器,就能在云端上使用其提供的運算能力,。企業(yè)用戶可以使用DGX運算資源來進行生成式AI或應用開發(fā),。
據(jù)悉,DGX是英偉達推出的AI超級電腦運算系統(tǒng),,此次新推出的DGX Cloud算力租賃服務是英偉達與甲骨文等合作伙伴共同打造的,。
至于DGX Cloud服務的訂閱收費,未來將按照每個實例/每個執(zhí)行個體來計算,,每月收費36999美元起,。每個實例包括8個NVIDIA H100或A100 Tensor核心GPU,每個GPU節(jié)點內(nèi)存高達640GB,,實現(xiàn)計算資源專用,,不和云中另外的租戶共享。
此外,,DGX Cloud本身也支持英偉達自家的AI軟件和開發(fā)工具,,比如Nvidia AI Enterprise提供端到端的AI框架與預訓練模型。
有望成算力供給主流模式之一
華福證券表示,,國內(nèi)具備研發(fā)及訓練大模型實力的企業(yè)較少,,隨著行業(yè)的充分競爭,,未來只會剩下1-2家大模型,采購服務器建設數(shù)據(jù)中心的重資產(chǎn)模式將產(chǎn)生大量的算力冗余,,以公有云方式部署的算力租賃將是最優(yōu)解,。
從算力租賃廠商前期布局的成本來看,核心成本主要集中在服務器研發(fā)和采購,、維護和升級等方面,,可通過特定的技術和管理手段來控制,如通過智能化管理降低管理成本,、與芯片廠商進行戰(zhàn)略合作降低采購成本等,。前期成本情況因公司規(guī)模不同而有所差異,大型廠商通常采用集中采購和規(guī)模效應來降低成本,,而小型廠商則主要通過定制化方案來滿足客戶需求,。
而站在用戶角度,基于算力租賃,,用戶只要按需付費,,不用承擔硬件設備的采購、維護,、升級等費用,,也不用擔心設備閑置或者過時造成浪費;用戶可隨時隨地通過云端訪問所需的算力資源,,快速開始訓練和應用,;用戶可根據(jù)需求選擇不同算力平臺和機型,也可以不受地域或者時間的限制模型,、工具等資源,,進行更多的嘗試和探索。
隨著大模型以及相關應用的發(fā)展,,算力需求呈現(xiàn)爆發(fā)式增長,。但除了大型互聯(lián)網(wǎng)企業(yè)、AI龍頭企業(yè)具有較多的GPU算力芯片儲備外,,中小企業(yè)在發(fā)展AI模型,、應用過程中,算力租賃或能成為廣大中小企業(yè)解決算力需求的選擇之一,。