GTC DC 2025:NVIDIA 展示新一代 Vera Rubin 晶片,推出 BlueField-4 和 NVQLink
近日,位於美國 華盛頓特區 的 NVIDIA GTC DC 2025 大會正式開幕,大會重頭戲自然是由NVIDIA (輝達) 創始人兼首席執行官 黃仁勳的主題演講,勾勒出AI時代的最新藍圖,從大規模GPU部署和量子技術突破,再到AI工廠、機器人技術和自動駕駛。
本次主題演講上,首度展示新一代Vera Rubin Superchip晶片與PCB電路,整合一個Vera CPU和兩個Rubin GPU,配備了8個SOCAMM模組。
其中CPU整合了88個客製化Arm內核,共176線程;且每個Rubin GPU 對應 8 個 HBM4 記憶體堆疊,容量為288GB。另外NVLINK-C2C 互聯頻寬達到了1.8TB/s,用於Vera CPU與Rubin GPU之間的連線。
相較於Blackwell Ultra B300 NVL72,在同一配置數量下(144個GPU晶片),Vera Rubin NVL144提供的FP4運算效能將從1.1 PFLOPS提升至3.6 PFLOPS。
雖然每個GPU對應的顯存都是288GB,但由於升級至HBM4,頻寬將從8TB/s提升至13TB/s;更將引進更快的NVLink,將總吞吐量提高一倍,達到260TB/s,新的ConnectX-9連結將達到28.8TB/s。
NVIDIA 在2027年的下半年還會推出Rubin Ultra,一方面保留 Vera CPU,另一方面將對GPU做加強,更換至HBM4E;同時整體機架將由新佈局Rubin Ultra NVL576 替代,單一機架規模解決方案內配備576個GPU。
這使得FP4推理計算效能飆升至15 ExaFLOPS,FP8訓練運算效能為5 ExaFLOPS,運算能力大約是Vera Rubin NVL144的4倍;另外NVLink和ConnectX-9連結速率也會持續提升,達到1.5 PB/s和115.2 TB/s。
並且 NVIDIA 更推出了NVIDIA NVQLink,這是一個開放式系統架構,可將GPU運算的極致性能與量子處理器緊密結合,實現來自QPU的實時CUDA -Q調用,延遲低至約4微秒,以構建加速的量子超級電腦。
研究人員和開發者可透過NVIDIA CUDA-Q軟體平台,整合來存取NVQLink,並創建和測試應用程式,無縫利用CPU、GPU和量子處理器,幫助業界為日後的量子超級電腦做準備。
目前已為17家QPU製造商、5家控制器廠商和9個美國國家實驗室,實現量子和GPU運算互聯。
NVIDIA 宣布 BlueField-4 DPU(資料處理器),作為全端式BlueField平台的一部分,可加速十億瓦級(Gigascale)AI基礎設施,提供強大的運算效能,支援800Gb/s的吞吐量並實現高效能推理處理,為AI資料儲存、網路和安全帶來突破性的突破性加速。
NVIDIA BlueField-4整合了Grace CPU和ConnectX-9網路技術,相較於先前的NVIDIA BlueField-3,可提供6倍運算能力且支援的AI工廠規模增加4倍,加速十億瓦級的AI基礎設施。
新平台還支援具有原生服務功能鏈的多服務架構,可在單一統一框架內實現多個網路、安全性和儲存服務的無縫整合和管理。
此外,NVIDIA 宣布與 Nokia (諾基亞) 合作打造支援6G的AI平台,推出AI原生無線6G技術棧NVIDIA Arc;基於NVIDIA Aerial平台,加速運算驅動;並且NVIDIA 也將以每股6.01美元的認購價,向 Nokia 注資10億美元,成為這項合作投資案的第二大股東。
 
			
			 
			





 
						 
						 
						 
						 
						 
						
 
					 
					 
					 
					 
					