- +1
英偉達更新產品路線圖,黃仁勛:每人都應關注機器人,這可能成為史上規模最大產業
AI(人工智能)芯片龍頭英偉達的CEO黃仁勛宣布了多項重要更新,著重強調推理模型帶來的芯片行業新機遇。
當地時間3月18日,黃仁勛在英偉達GTC大會上發表主題演講。在這場持續了兩個多小時的演講中,黃仁勛宣布基于Blackwell架構的最新芯片Blackwell Ultra(GB300)和下一代Rubin架構將如期推出,同時,公司將在機器人領域持續加碼。
18日下午一點,身穿經典黑色皮衣的黃仁勛登臺亮相。面對座無虛席的美國加州圣何塞SAP中心,黃仁勛感慨:“多么精彩的一年……我們有很多精彩的事情可以分享。”他還笑稱,GTC曾經被稱為AI界的“伍德斯托克(Woodstock)音樂節”,如今已然發展成了AI界的美國橄欖球聯盟總決賽“超級碗”。
Tokens成演講熱詞,計算機“已經成為tokens生成器”
回顧英偉達一路走來的歷程,黃仁勛表示,今年已是GeForce顯卡誕生以來的第25年。在大約十年前,始于感知人工智能和計算機視覺的AI開始真正進入全世界的視野。目前,我們正處于生成式人工AI階段,將走向智能體AI時代,隨后是物理AI時代,也就是機器人將登場的地方。

來源:英偉達直播
黃仁勛接著談到,目前,我們已經擁有了3條縮放法則(Scaling Law):從感知AI到生成式AI的預訓練擴展,到更強生成式AI的后訓練擴展,再到長思考模型的測試時訓練擴展,讓AI學會了推理。黃仁勛指出,縮放法則其實依然有效,甚至超出預期:“去年,幾乎全世界都搞錯了。大家以為縮放法則失效,但實際上,現在AI推理所需的計算量比去年人們所以為的要高出100倍。”

三條縮放法則。來源:英偉達直播
順著這個邏輯,黃仁勛強調,AI發展的潛力遠超出人們的預期,AI的下一步發展將通過改進訓練和知識工作來實現。他認為,AI推理能力的提升可能會帶來下一個重大突破,而tokens(AI模型處理中的最小數據單位)的日益普及是這種變化中的重要組成部分:“計算機已經成為tokens生成器,而不是文件檢索器。”
因此,黃仁勛指出,隨著AI變得越來越智能、應用范圍越來越廣,并且獲得更多資源來推動其發展,AI正在經歷一個轉折點。他預計,隨著對AI和新計算方法的需求不斷增長,全球數據中心的建設規模將很快超過一萬億美元。
在詳細介紹了CUDA編程語言在DNA基因測序、5G/6G信號處理、量子計算等領域中做出的貢獻之后,黃仁勛重新講回AI,并宣布了一系列合作。英偉達將與幾家電信企業合作開發基于人工智能的6G無線技術,合作伙伴包括T-Mobile、Mitre、思科、ODC和Booz Allen。
在自動駕駛領域,英偉達將與通用汽車(GM)擴大合作伙伴關系。通用汽車將使用英偉達的計算平臺(包括Omniverse和Cosmos)構建定制AI系統,以優化通用汽車的工廠規劃和機器人技術。
黃仁勛還宣布,公司將推出端到端自動駕駛汽車全棧綜合安全系統Nvidia Halos,正在開發中的每一行代碼都將由第三方進行安全評估。一段宣傳片顯示,英偉達的實時協作模擬平臺Omniverse和Cosmos能夠訓練自動駕駛程序,使其從各種環境變化中學習并實現自我提升。
AI芯片路線圖繼續更新,再下一代芯片名為“Feynman”
演講開始近一個小時后,終于到了萬眾矚目的數據中心部分。雖然去年GTC上宣布的Blackwell芯片才剛全面投產不久,市場已經在密切關注下一代芯片的動向。
在今天的演講中,推理成為了關鍵詞。黃仁勛展示了一張圖表,兩條軸中一條顯示用戶每秒處理的標記數,另一條顯示工廠每秒處理的標記數。黃仁勛指出,“大規模的推理是一種極端的計算任務”,需要確保AI既智能又能響應迅速,“這一切都是為了攻克推理問題”。

黃仁勛強調推理和tokens的聯系。來源:英偉達直播
為了驗證這一點,英偉達將“傳統模型”Llama 3.3與推理模型DeepSeek R1進行了對比。在回答同一個關于婚禮座位安排的問題時,Llama 3.3 70B模型在一次推理中使用了439個tokens,雖然耗時較短,但得出了錯誤的答案。而DeepSeek R1模型則使用了近9000個tokens,雖然耗費了更多的計算資源和時間,但得出了正確答案。

傳統大模型與推理模型的對比。來源:英偉達直播
在這個案例中,推理模型所需的tokens是傳統大型語言模型的20倍,計算資源更是高達150倍,但它確實能得出正確答案,節省了大量被浪費的tokens。黃仁勛指出,隨著下一代模型可能擁有數萬億個參數,像英偉達Blackwell NV72這樣強大的系統將發揮至關重要的作用。
經過漫長的鋪墊后,黃仁勛宣布推出“AI工廠的操作系統”NVIDIA Dynamo。Dynamo被稱為一個“分布式推理服務庫”,作為一個開源解決方案,旨在解決用戶對tokens的需求與無法生產足夠tokens之間的平衡問題。黃仁勛還展示了Dynamo的多位合作伙伴,微軟和Perplexity也出現在其中。
黃仁勛表示:“在推理模型方面,Blackwell的性能是Hopper的40倍?!彪m然Blackwell在推理性能上相較Hopper實現了巨大飛躍,但“我們是一個功耗受限的行業”。因此,Dynamo可以通過提高單個用戶每秒處理的tokens數量,從而進一步提升性能,意味著整體響應速度將變得更快。
在對Hopper進行了一番“拉踩”、對Blackwell進行大力推銷后,黃仁勛又一次搬出了自己的經典觀點:“買得越多,省得越多?!痹贒ynamo技術加持下,搭建AI工廠的廠商還能實現“買得越多,賺得越多”。
今年2月,英偉達發布2025財年第四財季財報,稱最新AI芯片Blackwell的銷量“超出預期”,在第四財季帶來了110億美元的收入,是公司有史以來增長速度最快的產品,其生產正在“全速進行”。
展望未來,黃仁勛表示,隨著Blackwell全面投入生產,全新加速計算平臺Blackwell Ultra NVL72平臺將于2025年下半年如期推出。該平臺的帶寬是前代Blackwell芯片的2倍,內存速度也快了1.5倍。

全新加速計算平臺Blackwell Ultra NVL72。來源:英偉達直播
在Blackwell之后,英偉達將迎來以天文學家Vera Rubin名字命名的Rubin架構。黃仁勛表示,下一代Vera Rubin NVL144平臺將于2026年下半年推出。接下來是Rubin Ultra NVL576平臺,其將于2027年下半年推出,作為一次“極致的擴展”,該平臺將擁有250萬個部件,并連接576個GPU,性能達到GB300的14倍。這聽起來有些不可思議,黃仁勛也補充稱這些預測確實有些超前,“但能夠讓你感受到我們正在前進的速度”。
黃仁勛還揭曉了在Rubin之后下一代AI平臺的名字“Feynman”,致敬諾貝爾物理學獎獲得者理查德·費曼(Richard Feynman)。費曼以對量子力學的路徑積分表述、量子電動力學、過冷液氦的超流性以及粒子物理學中部分子模型的研究而聞名。

英偉達未來產品路線圖。來源:英偉達直播
發布人形機器人通用開源模型
此外,黃仁勛還宣布將推出以太網產品NVIDIA Photonics,Spectrum-X Photonics和Quantum-X Photonics將于2026年下半年推出。公司還將發布兩款由Grace Blackwell支持的個人AI超級計算機DGX Spark和DGX Station。
DGX Spark在今年1月的國際消費類電子產品展覽會(CES 2025)上作為“Project Digix”首次亮相,售價3000美元,搭載縮小版的GB10超級芯片,已經開始接受預約。據介紹,GB10每秒可執行高達1000萬億次的AI運算,使其成為微調最新AI推理模型的理想之選。
DGX Station則為需要更多AI處理能力的專業研究人員準備,配備了GB300 Ultra Desktop超級芯片,提供20 petaflops的性能和784GB的統一系統內存。NVIDIA 尚未公布DGX Station的價格,這款電腦將于今年晚些時候上市,
最后,黃仁勛以機器人作為本次演講的收尾,宣布了一款面向人形機器人的通用開源基礎模型GR00T N1。黃仁勛表示:“每個人都應關注(機器人)這一領域,這很可能成為有史以來規模最大的產業。”
雖然黃仁勛的本次演講可謂是“干貨滿滿”,但似乎未能止住英偉達股價的下跌勢頭。18日當天,隨著美股科技股再度普遍走低,英偉達(Nasdaq:NVDA)股價收于每股115.43美元,跌3.43%,總市值2.83萬億美元。
自今年年初的大漲以來,英偉達股價長期處于下跌狀態,原因是美股科技股普遍遭遇拋售,且市場擔心芯片市場競爭加劇和AI投資支出的回落將影響對英偉達Blackwell處理器系列的需求。
此外,1月20日,中國AI初創公司深度求索(DeepSeek)推出高性價比且高性能的開源大模型DeepSeek-R1,隨后在國際市場上引發轟動,導致英偉達市值在從1月24日起的短短三天內蒸發6000億美元。
當地時間3月20日,黃仁勛還將參加一場以量子計算為主題的會議,參會者包括來自量子行業的十幾位CEO和高管。





- 報料熱線: 021-962866
- 報料郵箱: news@thepaper.cn
互聯網新聞信息服務許可證:31120170006
增值電信業務經營許可證:滬B2-2017116
? 2014-2025 上海東方報業有限公司