一場約90分鐘的演講,黃仁勛成功地讓CES變?yōu)閭人秀場。 當(dāng)?shù)貢r間1月6日晚間,黃仁勛在CES 2025(國際消費類電子產(chǎn)品展覽會)上發(fā)表了開幕演講。 不同于往日身著“壓花小牛皮”的傳統(tǒng)裝扮,黃仁勛這次選擇了一件字面意義上“閃亮全場”的鱷魚皮夾克,似乎也暗示了今晚的英偉達(dá)將非比尋常。 在短短數(shù)語回顧了英偉達(dá)在GPU行業(yè)的成績后,RTX 50系列顯卡當(dāng)仁不讓地打了頭陣。簡單概述就是,該系列產(chǎn)品算是游戲玩家中“等等黨”的一次大勝利。 ![]() 不過,對于英偉達(dá)來說,今晚需要登臺的主角不止一位。包括世界基礎(chǔ)模型Cosmo、“掌上AI超算”Project Digits也完成首次亮相。 在2025年開年,英偉達(dá)扔出了一串“王炸”。 “等等黨”的大勝利 黃仁勛素以“刀法精湛”而聞名,但這次發(fā)布會上亮相的RTX 50系列產(chǎn)品結(jié)合價格來看,好像還挺良心的。 先說下該系列產(chǎn)品的重要升級。 與前代RTX 40系列相比,最大的不同自然是架構(gòu),此前英偉達(dá)在高性能計算卡B200上發(fā)布的Blackwell架構(gòu),這次被下放到了消費級平臺RTX 50系列上。 該架構(gòu)帶來的升級包括全新的Transformer引擎和NVLink技術(shù),還有在改用臺積電4NP后,暴增的CUDA核心數(shù)量以及能耗表現(xiàn)的大幅提升。 具體到產(chǎn)品上,該系列的旗艦產(chǎn)品RTX 5090芯片,搭載了21760個CUDA核心,成為首個核心數(shù)突破20000大關(guān)的Geforce顯卡。 在920億個晶體管的加成下,RTX 5090每秒可實現(xiàn)超過3352萬億次AI運算,同時搭配512bit位寬的32GB GDDR7顯存,性能較上代旗艦產(chǎn)品RTX 4090提升近兩倍。 這里值得一提的是GDDR7顯存的應(yīng)用。在本代RTX 50系列產(chǎn)品上,GDDR7屬于全線標(biāo)配,這個顯存的升級有多大呢? 舉個典型的例子是,在RTX 5080顯卡上,其顯存位寬繼續(xù)沿用4080顯卡的256bit規(guī)格,但顯存帶寬直接達(dá)到了960Gb/s,已經(jīng)逼近上代旗艦RTX 4090D的水平,且算力大幅超過后者。 考慮到有大模型公司用RTX 4090D顯卡做模型訓(xùn)練,那么未來作為“準(zhǔn)旗艦顯卡”的RTX 5080,或許亦能勝任這類工作。 而在CES現(xiàn)場,老黃的表述要更為夸張,他表示RTX 5070 GPU相當(dāng)于“RTX 4090 Performance”。 不過,黃仁勛并沒有直接點明,RTX 5070 GPU究竟是哪方面能與RTX 4090持平,畢竟從參數(shù)上,無論是CUDA核心數(shù),還是顯存帶寬上,兩者差別巨大。 唯一的可能是,在DLSS 4的加持下,RTX 5070顯卡的幀率表現(xiàn)可能達(dá)到RTX 4090的水平。 全新的DLSS 4仍然可以看作是一種“AI插幀”技術(shù),但與上代DLSS 3相比,這次英偉達(dá)將幀生成技術(shù)做了升級,現(xiàn)在每個傳統(tǒng)渲染幀生成之外,還能最多生成三個額外幀,使游戲畫面幀率提升8倍。
此外,DLSS 4還整合了多幀生成、光線重建及超級分辨率(Super Resolution)等多種技術(shù),利用生成式AI提升材質(zhì)壓縮和游戲畫面質(zhì)量。 不過還是得吐槽下,雖然RTX 50系列全系標(biāo)配的DLSS 4對于畫面幀率提升巨大,但以此論證新一代中端產(chǎn)品表現(xiàn)相當(dāng)于上代旗艦產(chǎn)品,多少有些“黃氏對比法”的意味。 最后說下價格: RTX 5090D旗艦顯卡國行 16499 元起,美版 1999 美元(注:由于眾所周知的原因,RTX 5090顯卡不在國內(nèi)市場開售,僅提供性能相近的5090D) RTX 5080 國行 8299 元起,海外 999 美元。 RTX 5070 Ti 國行暫未公布,美版 749 美元(當(dāng)前約 5492 元人民幣) RTX 5070 國行暫未公布,美版 549 美元(當(dāng)前約 4026 元人民幣) 應(yīng)該說,這次RTX系列的產(chǎn)品迭代,實現(xiàn)了真正意義上的“加量不加價”,而在消費級產(chǎn)品外,本次黃仁勛的演講也是驚喜滿滿。 物理AI,英偉達(dá)的新野望? 在講完RTX 50系列顯卡及Blackwell架構(gòu)芯片進(jìn)展后,黃仁勛還“蹭了下熱點”,發(fā)布了現(xiàn)階段英偉達(dá)版的AI Agents——“Blueprint for AI Agents” 這是一款基于英偉達(dá)Metropolis系統(tǒng)的平臺,旨在幫助組織和個人提升生產(chǎn)力及安全性。它能夠允許開發(fā)者利用強大的視覺感知能力,創(chuàng)建并分析視頻內(nèi)容,速度是傳統(tǒng)實時觀看的30倍。 黃仁勛還通過一段視頻展示了該平臺未來可以協(xié)助的工作,包括搜索助手、金融分析、工廠運營等。 這位AI行業(yè)的“執(zhí)劍人”還畫下了一張大餅,他認(rèn)為未來每家公司的IT部門都將成為AI Agents的人力資源部門,AI Agents可能帶來超過一萬億美元的市場機會。 不過,現(xiàn)場觀眾對AI Agents的反響似乎并不強烈,而黃仁勛也適時地甩出了新的焦點——旨在理解物理世界的基礎(chǔ)模型Cosmos。 這是一套專為物理交互、模擬工廠環(huán)境及駕駛環(huán)境生成而構(gòu)建的模型,包含了自動回歸模型、擴散基礎(chǔ)、高級標(biāo)記器和AI加速數(shù)據(jù)管道等組件,可從文本、圖像和視頻等輸入以及機器人傳感器或運動數(shù)據(jù)的組合中生成基于物理的視頻。 黃仁勛表示,這些模型基于18000萬億次tokens和2000萬小時視頻的訓(xùn)練。 “物理AI模型開發(fā)成本高,需要大量真實世界數(shù)據(jù)和測試,Cosmos為開發(fā)人員提供了一種簡單的方法來生成大量基于物理的合成數(shù)據(jù),以訓(xùn)練和評估模型。開發(fā)人員只需提供一個文本描述,Cosmos就能生成一個遵守物理定律的視頻!秉S仁勛認(rèn)為,Cosmos將顯著地減少機器人訓(xùn)練與自動駕駛訓(xùn)練的成本。 未來Cosmos將推出包括Nano、Super、Ultra三種尺寸從40億參數(shù)到140億參數(shù)不等的模型,開發(fā)者可在GitHub以及Hugging Face平臺上獲取,并在獲得英偉達(dá)開放模型許可協(xié)議后,用作商業(yè)用途。 在發(fā)布會現(xiàn)場,英偉達(dá)并沒有過多展示該模型的應(yīng)用案例,只是表示目前Wayve、Uber等公司已經(jīng)開始將Cosmos模型用于自家自動駕駛訓(xùn)練。 在Cosmos模型之外,英偉達(dá)還公布了數(shù)字孿生領(lǐng)域的進(jìn)展——Omniverse Blueprint框架。 去年8月,英偉達(dá)曾展示過這個框架的基礎(chǔ)能力,包括“實時物理求解器”、“對大規(guī)模數(shù)據(jù)集的實時可視化能力”兩項核心功能。 而現(xiàn)在英偉達(dá)對這個框架做了升級,在整合英偉達(dá)CUDA-X AI和HPC庫、Modulus物理AI框架后,發(fā)布了4個全新的Ominverse BluePrint框架,包括可用于在數(shù)字孿生中大規(guī)模測試、優(yōu)化機器人任務(wù)及路徑的Mega;可回訪自動駕駛數(shù)據(jù),并生成地面真實數(shù)據(jù)的自動駕駛仿真;以及幫助開發(fā)人員構(gòu)建數(shù)字孿生沉浸式流播的應(yīng)用;還有面向計算機輔助工程的實時數(shù)字孿生。 如果把Omniverse與Cosmos相結(jié)合,即可為開發(fā)人員提供一個基于真實物理世界的多元生成器,未來具身智能的開發(fā)速度將會被大幅度提高。如果把這個組合用于自動駕駛技術(shù)開發(fā),甚至能在特定情況下做到無數(shù)據(jù)收集訓(xùn)練。 掌上AI超算,改變游戲規(guī)則? 在演講的“One More Thing”時間段,黃仁勛拿出了壓軸之作——Project Digits,一款可以稱之為“掌上AI超算”的產(chǎn)品。 “在生成式AI時代,每位數(shù)據(jù)科學(xué)家、AI研究人員和學(xué)生的桌面上都應(yīng)該擺放一臺像Project Digits一樣的個人AI超級計算機,讓他們能夠參與并塑造這個時代。”黃仁勛以此解釋開發(fā)Project Digits的初衷。 它的尺寸略大于蘋果的Mac Mini,但卻可以提供堪比數(shù)據(jù)中心的算力。 Project Digits搭載了全新的GB10 Grace Blackwell芯片,根據(jù)英偉達(dá)的命名規(guī)則可以看出,這款桌面計算機集成了ARM核心的Grace CPU核心,基于這枚芯片強大的能耗表現(xiàn),Project DIGITS僅使用標(biāo)準(zhǔn)電源插座即可使用。 據(jù)悉,Project Digits具有128GB的內(nèi)存和高達(dá)4TB的 NVMe存儲,可以在FP4計算精度下,提供高達(dá)1 PFLOPS(千萬億次浮點運算/秒)的AI性能。 開發(fā)者可通過單臺設(shè)備在桌面運行2000億參數(shù)的大模型,如果使用NVIDIA ConnectX網(wǎng)絡(luò)將兩臺Project Digits可以連接起來,就可運行多達(dá)4050億參數(shù)的模型,這基本可以覆蓋目前市面上大部分大模型產(chǎn)品。 值得一提的是,開發(fā)者還可以在Project Digits上開發(fā)和運營模型推理,然后在使用相同的Blackwell架構(gòu)和NVIDIA AI Enterprise 軟件平臺的云端或數(shù)據(jù)中心基礎(chǔ)設(shè)施上進(jìn)行無縫部署。 從定位上來看,Project Digits完全開創(chuàng)了一個新的產(chǎn)品種類,而且從其預(yù)裝NVIDIA DXG基礎(chǔ)操作系統(tǒng)和NVIDA AI軟件棧來看,已經(jīng)最大程度上做到了降低開發(fā)者的使用門檻,盡量吸納更多的從業(yè)人群。 可以預(yù)見,如果類似的產(chǎn)品未來在AI行業(yè)中成為主流,開發(fā)者對AI云計算資源的依賴會大幅降低,在傳統(tǒng)的軟硬件技術(shù)棧之外,英偉達(dá)或許又挖掘到了新的生態(tài)位。 本文來源:虎嗅 |
原創(chuàng)欄目
IT百科
網(wǎng)友評論
聚超值•精選