就在昨天,國際電腦展前夕,英偉達創(chuàng)始人兼 CEO 黃仁勛回到母校中國臺灣大學,洋洋灑灑講了將近兩個小時。 從最基礎(chǔ)的 AI 技術(shù)講到生成式 AI ,從軟件講到硬件,從 CPU 講到 GPU 等等等等。。。 乍一看貌似和計算相關(guān)的,黃仁勛都講了個遍。但世超仔細咂摸了一下,倒覺得從頭到尾他想講的,就只有一個:未來是加速計算的世界,而英偉達,正在參與搭建這個世界。 加速計算,其實就是 GPU 計算,它把密集計算的部分都交給比較擅長的 GPU 去處理,剩下的控制部分則交給 CPU ,而在 GPU 沒出來之前,這些活都是 CPU 做的。 考慮到整場演講時間太長,沒耐心看完的差友們,可以直接看世超給大伙劃的重點。 老樣子,一開場老黃就先跟大伙們聊了半個小時計算機和英偉達的發(fā)展史,當年把第一臺 DGX-1 超級計算機送給 OpenAI 的事情也算是老演員了。 總之這半個小時,老黃就是為了給咱們前情提要一下,在之前通用計算已經(jīng)通貨膨脹得不行了,現(xiàn)在最需要的,是讓加速計算給它疏通疏通。 而英偉達手里,就握著疏通的兩個利器,一個是GPU ,一個是CUDA 。 GPU 大伙們都很熟了,和 CPU 配合下,最快能讓計算速率提升 100 倍,但成本只是原來的 1.5 倍。老黃那句 “ 買越多,省越多 ” 的至理名言就是從這來的。 CUDA 可能好多人還整不明白,這么說吧,它就相當于是英偉達造出來的一個環(huán)境生態(tài),在這個環(huán)境下造出來的軟件,能讓GPU 的算力被最大限度開發(fā)出來。 這些年來,圍繞 CUDA 建起來的軟件生態(tài),少說也有好幾籮筐了。像是物理領(lǐng)域的 Modulus 、通信領(lǐng)域的 Aerial RAN 、基因序列的 Parabricks 等等,都有專門的 CUDA 軟件。 在CUDA 生態(tài)下運行的數(shù)據(jù)科學庫 Pandas ( 右 ) 如果說之前,GPU 和 CUDA 還只是讓計算速度快點的工具,歸根結(jié)底,各個領(lǐng)域還是各玩各的。 而 ChatGPT 這類生成式 AI 的出現(xiàn),算是把算力變成了一種通用的貨幣。 用老黃的比喻來說, GPU 和 CUDA 直接變成了 “ AI 工廠 ” 的磚和瓦,在這個新的 AI 工廠,生成的tokens 數(shù)搖身一變成了新的商品。 咱也都知道,光看 AI 現(xiàn)在的發(fā)展速度,算力肯定是不夠用。 但先別急,老黃直接甩出了這些年來他們硬件提升的數(shù)據(jù),還拉來了摩爾定律做對比?催@陡峭的折線圖,是把摩爾定律按在地上摩擦。 而吊打摩爾定律的,是英偉達剛投產(chǎn)的 Blackwell 芯片,這是專門給 AI 生成 tokens 設(shè)計的。 演講的過程中,老黃還拿 Blackwell 芯片和八年前的 Pascal 做了個直觀的對比,同樣是生成一個 token , Pascal 消耗的能量,相當于兩個 200 瓦燈泡亮兩天,而現(xiàn)在一個 token 只要 0.4 焦耳。。。 也就是說,新的 Blackwell 芯片把生成 token 的能量降低了 45000 倍,世超可沒多打一個 0 。 不僅如此,老黃的新芯片在 “ 蓋房子 ” 這塊兒,也得心應(yīng)手了很多,兩塊 Blackwell 芯片能像搭積木一樣拼成超級芯片。 緊接著,把 36 個這樣的超級芯片組合在一起,就能變成一個服務(wù)器。 最后把這些服務(wù)器串在一塊兒,這就是妥妥的一座超級 “ AI 工廠 ” 。 這還沒完,老黃還沒想停手,在這次演講中,他直接把英偉達后面的計劃給說出來了,打算做 “ AI 界的蘋果 ” ,把原來兩年更新一次芯片的頻率提升到一年更新一次,每年都要給自己的 “ AI 工廠 ” 裝潢加固下。 就比如, 2025 年會推出 Blackwell Ultra 。而且他們現(xiàn)在就已經(jīng)在為 Blackwell 芯片開發(fā)的下一代平臺 Rubin ,準備 2026 年發(fā)布,而且新平臺還會用全新的 GPU 。 另外,在老黃構(gòu)想中的 AI 工廠里,可不只有這些硬件,各種軟件和服務(wù)他也不想落下,這咱在英偉達搞 CUDA 的時候就能窺見一二。 而在 AI 時代,除了造芯片,老黃還給開發(fā)者們提供了一些服務(wù),整出了個NIMs ( 英偉達推理微服務(wù) )。 它就相當于一個 AI 盒子,里面集成了兩百多家企業(yè)的技術(shù),供全世界的 2800 萬個開發(fā)者們使用,包括預訓練好的 AI ,用于推理服務(wù)的 Trition 服務(wù)器等等。 NIM 也會在開發(fā)者們用這些技術(shù)的時候,給他們加速,就比如,在相同的計算資源下,在 NIM 里面運行 Meta 的 Llama 3-8B 的時候,生成的 tokens 數(shù)量比平時多了三倍。 總的來說,在老黃這里,你不僅能買到算力,還能直接在他那兒開發(fā) AI ,是一點不讓錢流到別人口袋。。。 也許是看時機成熟了,在演講過程中,老黃還提到了一個之前從來沒說過的計劃:數(shù)字孿生地球( Earth-2 )。 這個項目在英偉達內(nèi)部已經(jīng)搞了好幾年了,為的就是能預測整個地球的未來,好讓我們能更好地應(yīng)對還沒到來的災(zāi)害。 反正世超在看完老黃的整場演講,覺得他就是想把英偉達搓成一根繩,串起整個 AI 時代。 能不能做到,咱現(xiàn)在也不好下結(jié)論。至少從現(xiàn)在來看,在AI 芯片領(lǐng)域,英偉達的地位是焊的死死的。 上周,英偉達剛發(fā)的第一季度財報就是很直觀的證據(jù),當季業(yè)績?nèi)娉A期,而里面增長最高的就是和 AI 相關(guān)的數(shù)據(jù)中心,同比增長了427% 。 當時不少媒體都拉來蘋果和英偉達對比,說它離蘋果只差一步之遙。 但同樣作為 “ 賣鏟人 ” ,網(wǎng)上還有不少論調(diào)稱,英偉達會是 AI 時代的思科,等泡沫破裂之后,自然會現(xiàn)出原形。 其實說實話,在世超來看,他們倆之間還不能完全劃等號。 最起碼英偉達不僅僅是一個賣鏟人,它在賣鏟的同時,還附加了不少服務(wù),之前有 CUDA ,現(xiàn)在又有了個 NIMs ,而這些服務(wù),才是它真正的護城河所在。 最后,世超想用老黃說過一句話做結(jié)尾, “ 當你無法辨別自己是獵人還是獵物時,奔跑就好了。 ” 而如今的英偉達,依舊在狂奔。。。 圖片、資料來源: 黃仁勛演講視頻、財聯(lián)社 本文來源:差評TV |
原創(chuàng)欄目
IT百科
網(wǎng)友評論
聚超值•精選