GTC DC 2025：NVIDIA 展示新一代 Vera Rubin 晶片，推出 BlueField-4 和 NVQLink

近日，位於美國華盛頓特區的 NVIDIA GTC DC 2025 大會正式開幕，大會重頭戲自然是由NVIDIA (輝達) 創始人兼首席執行官黃仁勳的主題演講，勾勒出AI時代的最新藍圖，從大規模GPU部署和量子技術突破，再到AI工廠、機器人技術和自動駕駛。

本次主題演講上，首度展示新一代Vera Rubin Superchip晶片與PCB電路，整合一個Vera CPU和兩個Rubin GPU，配備了8個SOCAMM模組。

其中CPU整合了88個客製化Arm內核，共176線程；且每個Rubin GPU 對應 8 個 HBM4 記憶體堆疊，容量為288GB。另外NVLINK-C2C 互聯頻寬達到了1.8TB/s，用於Vera CPU與Rubin GPU之間的連線。

相較於Blackwell Ultra B300 NVL72，在同一配置數量下（144個GPU晶片），Vera Rubin NVL144提供的FP4運算效能將從1.1 PFLOPS提升至3.6 PFLOPS。

雖然每個GPU對應的顯存都是288GB，但由於升級至HBM4，頻寬將從8TB/s提升至13TB/s；更將引進更快的NVLink，將總吞吐量提高一倍，達到260TB/s，新的ConnectX-9連結將達到28.8TB/s。

NVIDIA 在2027年的下半年還會推出Rubin Ultra，一方面保留 Vera CPU，另一方面將對GPU做加強，更換至HBM4E；同時整體機架將由新佈局Rubin Ultra NVL576 替代，單一機架規模解決方案內配備576個GPU。

這使得FP4推理計算效能飆升至15 ExaFLOPS，FP8訓練運算效能為5 ExaFLOPS，運算能力大約是Vera Rubin NVL144的4倍；另外NVLink和ConnectX-9連結速率也會持續提升，達到1.5 PB/s和115.2 TB/s。

並且 NVIDIA 更推出了NVIDIA NVQLink，這是一個開放式系統架構，可將GPU運算的極致性能與量子處理器緊密結合，實現來自QPU的實時CUDA -Q調用，延遲低至約4微秒，以構建加速的量子超級電腦。

研究人員和開發者可透過NVIDIA CUDA-Q軟體平台，整合來存取NVQLink，並創建和測試應用程式，無縫利用CPU、GPU和量子處理器，幫助業界為日後的量子超級電腦做準備。

目前已為17家QPU製造商、5家控制器廠商和9個美國國家實驗室，實現量子和GPU運算互聯。

NVIDIA 宣布 BlueField-4 DPU（資料處理器），作為全端式BlueField平台的一部分，可加速十億瓦級（Gigascale）AI基礎設施，提供強大的運算效能，支援800Gb/s的吞吐量並實現高效能推理處理，為AI資料儲存、網路和安全帶來突破性的突破性加速。

NVIDIA BlueField-4整合了Grace CPU和ConnectX-9網路技術，相較於先前的NVIDIA BlueField-3，可提供6倍運算能力且支援的AI工廠規模增加4倍，加速十億瓦級的AI基礎設施。

新平台還支援具有原生服務功能鏈的多服務架構，可在單一統一框架內實現多個網路、安全性和儲存服務的無縫整合和管理。

此外，NVIDIA 宣布與 Nokia (諾基亞) 合作打造支援6G的AI平台，推出AI原生無線6G技術棧NVIDIA Arc；基於NVIDIA Aerial平台，加速運算驅動；並且NVIDIA 也將以每股6.01美元的認購價，向 Nokia 注資10億美元，成為這項合作投資案的第二大股東。

消息來源 : 1 , 2 , 3