老黃的新GPU又在深夜炸場,震撼了所有的觀眾。 除了硬件參數(shù)上的震撼之外,大家伙最想知道的還是新GPU的售價(jià)會(huì)不會(huì)同樣震撼。 下面就讓我們從規(guī)格參數(shù)、工藝節(jié)點(diǎn)、封裝設(shè)計(jì)等方面來深入分析一下新一代Blackwell GPU的系統(tǒng)、定價(jià)、利潤,以及Jensen's Benevolence(老黃的仁慈) 在這個(gè)大模型的時(shí)代,英偉達(dá)正處于世界之巔,擁有至高無上的定價(jià)權(quán)。 需要AI算力的用戶沒有更好的選擇,于是不得不接受英偉達(dá)「用銀湯匙喂給他們的東西」,——毛利率超過85%的H100就是最好的例子。 而這一代B100在性能和總體擁有成本方面的優(yōu)勢依然保持不變,超越了AMD的MI300X、英特爾的Gaudi 3。 不過這次新系列GPU的定價(jià),可能會(huì)讓很多人大吃一驚,也許我們會(huì)說「B」代表的不是「Blackwell」架構(gòu),而是「Benevolence」(老黃的仁慈)。 ——因?yàn)锳I時(shí)代的主宰和救世主黃仁勛正在向全世界微笑,尤其是對于「GPU-poor」(缺乏GPU的用戶)來說。 B100 / B200規(guī)格 首先,Blackwell架構(gòu)將2個(gè)GPU芯片粘在了一起,而工藝制程仍然保持在4nm,跟上一代的Hopper架構(gòu)一樣。 ——在以往發(fā)布的最新數(shù)據(jù)中心GPU上,英偉達(dá)都會(huì)采用更新的工藝制程,而這一次沒有。 這是因?yàn)榕_積電最初的3納米N3B工藝存在問題,所以英偉達(dá)不僅沒有吃到提升制程的紅利,還不得不把硅片的總量增加一倍。 此外,新架構(gòu)使用了8-hi HBM3E,容量高達(dá)192GB,這些顯存的供應(yīng)商是SK Hynix和Micron。 盡管其中絕大部分來自SK Hynix,但這也改變了SK Hynix作為H100顯存唯一供應(yīng)商的局面。 至于早就宣布要開發(fā)"世界上最快"的HBM3E的三星,目前仍然差點(diǎn)意思。 GPU的進(jìn)化趨勢是在更大的封裝中使用更多的硅片(包括邏輯和存儲器),而目前硅基插值器(silicon-based interposers)的尺寸已達(dá)到極限。 尺寸的增大會(huì)使硅片的生產(chǎn)面臨更多問題,從而降低產(chǎn)量。相比于上一代,B100的封裝尺寸要大得多,它將成為首款采用CoWoS-L的大容量產(chǎn)品(CoWoS-L是一種帶有無源硅橋的有機(jī)RDL基底面)。 Umbriel 和 Miranda Blackwell的第一個(gè)版本代號叫Umbriel,它保留了前代PCIe Gen 5、400G網(wǎng)絡(luò)等,B100風(fēng)冷式700W甚至可以無縫接入現(xiàn)有的H100和H200服務(wù)器底板。 不過B200的功率上限將提高到1000W,就需要重新設(shè)計(jì)服務(wù)器了。當(dāng)然也有信息顯示,1000W版本仍然可以采用風(fēng)冷方式,令人感到意外。 標(biāo)準(zhǔn)版GPU的代號是Miranda,擁有PCIe Gen 6和800G的網(wǎng)絡(luò),而顯存容量更是高達(dá)192GB。 目前,英偉達(dá)已經(jīng)買斷了所有36GB HBM的供應(yīng),SK Hynix和Micron將在明年初開始生產(chǎn)。這意味著,每塊GPU的容量實(shí)際上可以達(dá)到288GB。 GB200平臺 在供應(yīng)鏈中,每個(gè)人都在討論的產(chǎn)品是Oberon GB200平臺,新平臺解決了GH200的許多問題。 首先,GB200將所需的CPU數(shù)量減半,從而在總體擁有成本(TCO)上占據(jù)了優(yōu)勢。——GH200的價(jià)格實(shí)在是太貴了,而大多數(shù)的AI負(fù)載,實(shí)際上用不到服務(wù)器上昂貴的英偉達(dá)Grace CPU所提供的功能。 很多時(shí)候,GH200中的Grace芯片只是充當(dāng)了世界上最昂貴的內(nèi)存控制器。在可以單獨(dú)購買GPU的場景下,基本上所有AI大公司都會(huì)選擇買更多的GPU,而不是英偉達(dá)的CPU。 另一方面,英偉達(dá)正試圖銷售帶液體冷卻的集成機(jī)架。 英偉達(dá)不愿意單賣GPU或者NVSwitch,雖然讓一些用戶感到不滿,但由于交換機(jī)背板、電源匯流排和冷卻系統(tǒng)的集成度要求很高,也算是無可厚非。 在新的液冷機(jī)架中,CPU、GPU、NVSwitches和ConnectX7網(wǎng)卡全部采用水冷技術(shù)。 機(jī)架有兩個(gè)版本:一種是120kW,可容納72個(gè)GPU(總功率有點(diǎn)過分了),機(jī)架頂部有10個(gè)計(jì)算托盤,中間有9個(gè)NVSwitch托盤,底部有8個(gè)計(jì)算托盤。 每個(gè)計(jì)算托盤包含4個(gè)GPU、4個(gè)網(wǎng)卡、2個(gè)CPU、768GB HBM和2,000GB LPDDR5X。這個(gè)版本會(huì)晚一些上市。 另一種是功率較低的版本,這版本的機(jī)架有36個(gè)GPU和9個(gè)計(jì)算托盤,可以通過NVLink擴(kuò)展連接兩個(gè)機(jī)架。 對大多數(shù)公司來說,這個(gè)版本可能更容易部署。英偉達(dá)已通知機(jī)架的ODM廠商準(zhǔn)備明年生產(chǎn)50,000個(gè)機(jī)架。 被卷到了 盡管B100為最終用戶提供了更好的性價(jià)比,但本身的制造成本卻增加了一倍以上。 SemiAnalysis表示,對于大批量超大規(guī)模定價(jià),B100基板的平均售價(jià)僅僅約240,000美元。這對許多人來說是一個(gè)驚喜,因?yàn)檫@遠(yuǎn)低于ASP逐代增長50%的預(yù)期。 那么為什么老黃的定價(jià)會(huì)如此仁慈?答案是被卷到了。 AMD的MI300目前成為了合格的競爭對手,已經(jīng)成功拿到了英偉達(dá)最大的兩個(gè)客戶Meta和微軟的大訂單,盡管AMD為此承擔(dān)了很大的技術(shù)風(fēng)險(xiǎn)、并盡力降低了利潤。 而另一方面,英偉達(dá)的所有主要客戶都在設(shè)計(jì)自己的芯片。雖然迄今為止,只有谷歌取得了成功,但亞馬遜仍在繼續(xù)推出Inferentia和Trainium,Meta也在長期押注MTIA,微軟同樣開啟了芯片之旅。 英偉達(dá)的防御形態(tài) 很明顯,生產(chǎn)成本翻倍,但售價(jià)增加得不算太多,B100的利潤率肯定是趕不上前代了。 H200也是如此,它的ASP與H100相同,但HBM顯著增加,從而增加了BOM。 而H20則更糟糕,盡管價(jià)格賣的更低,但實(shí)際上它與H100使用了相同的GPU芯片,HBM容量也從80GB增加到96GB,因此總體BOM成本實(shí)際上也增加了。 ——以上的分析雖然聽起來很可怕,不過別擔(dān)心,毛利率只會(huì)再下降幾個(gè)百分點(diǎn)而已。 SemiAnalysis對此評價(jià)道:“英偉達(dá)更關(guān)心毛利潤和市場份額,而不是毛利率。過分擔(dān)心幾個(gè)百分點(diǎn)是精打細(xì)算的人所做的事情,而不是像黃仁勛這樣的有遠(yuǎn)見的人所做的,他想以仁慈的計(jì)算獨(dú)裁者的身份統(tǒng)治世界。” 畢竟,英偉達(dá)在數(shù)據(jù)中心上的收入持續(xù)飆升,并且正在實(shí)現(xiàn)供應(yīng)鏈多元化,從800G收發(fā)器到電力傳輸組件,——老黃正在下一盤大棋。 也許,隨著時(shí)代的發(fā)展,英偉達(dá)這個(gè)顯卡帝國可能不得不轉(zhuǎn)換成防御形態(tài),因?yàn)橛布蛙浖系淖o(hù)城河,都不會(huì)永遠(yuǎn)堅(jiān)不可摧。 但也許,新的帝國正在誕生之中。 參考資料:https://www.semianalysis.com/p/nvidia-b100-b200-gb200-cogs-pricing 文章來源:新智元
|
原創(chuàng)欄目
IT百科
網(wǎng)友評論
聚超值•精選