英偉達在2024年掀起了一場AI風暴,不僅市值超越蘋果、特斯拉站上了世界之顛,也讓他的創立者黃仁勛一直處于暴風眼的中心。
世界愿意傾聽他對未來世界的判斷與預言。
在2025年年初CES的開幕演講中,黃仁勛斷言:
「機器人技術的ChatGPT時刻即將到來。」
他總結說AI的發展經歷了三個階段:
初始階段是感知式AI,即理解圖像、文字和聲音;
之后是生成式AI,可以創造文本、圖像和聲音;
現在,我們正在進入物理AI的時代,即能夠運行、推理、計劃和行動的AI。這為包括自動駕駛汽車、游戲、機器人在內的多個行業帶來了突破性發展。
機器人和智駕是黃仁勛認為物理AI的兩大應用場景。
皮衣愛好者老黃在2025年一手推開了物理AI的大門。
▲圖源:NVIDIA
相比AI算力最高可達2375 TOPS的RTX 50系列GPU,全新物理AI模型Cosmos的推出有望迅速彌合物理AI的數字鴻溝,而在智駕方面,這一模型為眾多落后一步的汽車企業和規模相對較小,數據擁有量不足的智駕公司開發基于端到端的高階智駕方案提供了一款高效、強大的工具。
所謂物理AI模型是相對認知AI、理解語言的基礎模型GPT而言。
Cosmos平臺由生成式世界基礎模型、高級tokenizer、護欄和加速視頻處理管線組成。最大的Cosmos模型參數規模大概140億(也就是14B),用2000萬小時的真實世界人類互動、環境、工業、機器人和駕駛數據訓練而成。
它將推動自動駕駛汽車(AV)和機器人等物理AI系統的發展。
不過,并非有了這個模型,就可以省去真實世界的數據。
這個方法仍然需要真實的司機收集數據,但幾千個司機的數據完全能夠在簡單的命令下生成數十億公里的新數據。
▲圖源:NVIDIA
Cosmos的邏輯是先投入海量資源,先打造一個靠譜的世界模型(通過大量圖像、音頻、視頻和文本數據訓練,讓機器對世界運作方式能夠進行推理),然后部分結合現實司機駕駛數據,與Omniverse數字孿生相關的各種資源結合,最終生成幾何倍數于真實數據的虛擬駕駛數據。
Cosmos與Omniverse合作,可以將兩個系統連接,形成物理落地的基礎框架,從而控制生成過程,成為未來機器人產業發展的關鍵起點。
也就是說一家年銷量僅有幾萬臺車輛的主機廠一樣可以實現幾十萬臺車輛的數據。
「與大語言模型一樣,世界基礎模型是推動機器人和自動駕駛汽車開發的基礎,但并非所有開發者都擁有自主訓練模型所需的專業知識和資源。我們創建Cosmos是為了普及物理AI,讓每一位開發者都能接觸到通用機器人技術。」
這對于在中國市場在高階智駕領域布局起步均晚一步的合資品牌以及高階智駕開發者無疑都是一大福音:既可以降低開發成本,又可彌補數據量的不足。
黃仁勛在談及推出Cosmos的原因時提到:
「隨著基礎AI的不斷改進,行業也意識到,推動人工智能發展的關鍵是物理人工智能。物理AI同樣需要基礎模型,正如認知AI依賴基礎模型一樣,GPT-3開啟了強大能力的新篇章。為了實現物理AI的基礎模型能力,我們發起了Cosmos項目,以達到這一能力水平并將其推向全球。」
「那么,我們能用這個模型做什么?自動駕駛汽車需要理解物理世界,機器人也需要理解物理世界。因此,Cosmos這樣的模型是實現多模態的起點。」
簡單地理解即是,Cosmos就是打通認知大模型和空間智能大模型的工具,最終推動VLA(視覺語言動作模型)的落地。
這對于智能駕駛和具身智能機器人無疑都是一大突破。
▲圖源:Merca2.0
在2025年的CES上,媒體和資本的焦點都聚焦在了機器人身上,智駕的關注度似乎在下降。
不過在黃仁勛對于物理AI的定義之下,智能汽車本質上已是物理AI的實用場景之一,或者說是自主機器的一個分支。
而事實上短期可以窺見利潤和應用前景的恰恰是智能駕駛,具身智能從技術成熟到商業模式落地還需要時間。
談到2025年的技術創新時,黃仁勛表示:
「未來所有的交通工具都會具備自動駕駛能力,或者至少能夠實現自動化操作。五年前,關于技術的成熟度我們還不確定。但現在可以非常肯定,傳感器技術、計算機技術和軟件技術已經非常成熟,我們將能夠實現這一目標。」
外界對于英偉達近年來在智駕市場的表現一直有不同看法。
一是雖然市場份額一直保持在40%以上,但沒有吃到智駕市場的紅利,智駕領域的營收只占其總營收的不到2%,二是具有革命意義的Thor芯片一再跳票,而在全球最大的智駕市場中國正面臨來自本土科技公司地平線、黑芝麻的激烈競爭,而英特爾、高通也在進入其領地,提供更具性價比的方案。
不過自2015年英偉達正式布局智駕業務始,在第十個年頭圍繞自動駕駛的實現路徑,英偉達在云端、軟件側、工具鏈等方面都進行了全方位、多角度的布局,甚至在安全驗證方面都已有了相對成熟的方案。
今天的英偉達在智駕行業的角色早已不僅僅是車端算力平臺的提供者,更是通過從云端訓練到車端推理的一系列的整體布局,實現了對自動駕駛行業的底層賦能。
在2025 CES上,跳票經年的Thor終于有了明確的量產交付時間——今年上半年。
▲圖源:NVIDIA 直播截圖
英偉達在CES展示了基于Thor打造的全新自動駕駛汽車平臺NVIDIA DRIVE AGX Hyperion。
DRIVE Hyperion被稱為業內首個也是唯一一個端到端自動駕駛平臺,它包括DRIVE AGX系統級芯片(SoC)、參考板設計、NVIDIA DriveOS汽車操作系統、傳感器套件以及主動安全和L2+ 駕駛堆棧。
NVIDIA DriveOS軟件平臺則包含了構建、調試、分析和部署自動駕駛汽車和自動駕駛汽車應用程序所需的所有軟件、庫和工具,能夠令車企快速推進自動駕駛技術的研發與應用。
目前,DRIVE Hyperion已通過兩家業內權威的汽車功能安全和網絡安全認證評估機構——TÜV SÜD和TÜV Rheinland的行業安全評估。
黃仁勛表示,梅賽德斯-奔馳、捷豹路虎、沃爾沃汽車等均已開始部署該平臺。
采用模塊化設計的DRIVE Hyperion平臺,用戶可以便捷地按需選用他們所要的功能,該平臺同時具有可擴展性,可升級并兼容未來各代DRIVE系統級芯片。
依照黃仁勛的預測:
「全球約有十億輛汽車,每年的總行駛里程可達數萬億英里。自動駕駛汽車是最大的機器人市場之一,隨著該市場的興起,NVIDIA Blackwell驅動的平臺將推動這場變革進入快車道。下一輪自主機器浪潮將依靠物理AI世界基礎模型理解現實世界并與之交互。NVIDIA DRIVE平臺專為這一新時代而打造,可提供強大的功能安全性和AI性能。」
NVIDIA DRIVE背后有三個關鍵計算平臺:
NVIDIA DGX平臺用于在數據中心訓練基于AI的堆棧;
運行在NVIDIA OVX平臺上的NVIDIA Omniverse平臺,用于仿真和合成數據的生成;
車載計算平臺NVIDIA AGX,用于處理實時傳感器數據以實現安全駕駛。
目前Cosmos已經加入到上述三個計算平臺方案之中,英偉達表示,對于開發者將獲得一個數據飛輪,它能將數千英里的人類駕駛里程轉化為數十億英里的虛擬駕駛里程,從而提升訓練數據的質量,從而加速端到端自動駕駛汽車開發和大規模部署。
NVIDIA全球副總裁,汽車事業部負責人吳新宙表示,隨著開發人員利用生成式AI的進步成果,自動駕駛車輛 (AV) 的性能將變得更加強大。
是的,面向乘用車市場的自動駕駛終于將走進現實。
▲圖源:NVIDIA 直播截圖
在與英偉達最新合作的汽車廠商名單中,豐田已經明確采用英偉達DRIVE AGX Orin平臺打造下一代汽車,并運行DriveOS操作系統。
在L4方面,Aurora、大陸集團和NVIDIA三方已宣布建立戰略合作伙伴關系,運行DriveOS的NVIDIA加速計算平臺將集成到Aurora Driver中,大陸集團已計劃在2027年量產L4級自動駕駛系統。
Cosmos世界基礎模型降低了物理AI的開發門檻,而DRIVE Hyperion平臺正在拉高自動駕駛的上限。
構建物理AI模型需要數PB(petabytes)的視頻數據以及數萬小時的計算來處理、整理和標記這些數據。
而Cosmos世界基礎模型使開發者能夠輕松生成大量基于物理學的逼真合成數據,以用于訓練和評估其現有的模型,他們還可以通過微調Cosmos WFM構建自定義模型。
Cosmos世界基礎模型的應用,一方面可以節省大量時間,提升研發效率;另一方面可以明顯減少經濟成本的投入,官方數據顯示,開發者能夠使用NVIDIA Blackwell平臺在14天內處理、整理和標記2000萬小時的視頻,如果單純使用CPU,則需要3年以上。
而NVIDIA DRIVE端到端自動駕駛汽車開發平臺已經成為自動駕駛技術研發領域的天花板級的平臺之一。
▲圖源:NVIDIA
英偉達在智駕領域已打造了一個工具齊全的「廚房」。
而這注定將改寫由中國智駕供應商主導的自動駕駛市場,關于L3落地的頭牌之爭,生成式AI已經給了這個行業更多的想像空間,一個完全自動駕駛的時代正被以英偉達為首的科技公司推動著加速到來。