LEADTEK NVIDIA RTX 6000 Ada Generation 專業繪圖卡開箱測試 / 生成 AI 算圖、Omniverse 創作
NVIDIA 新一代專業繪圖卡「NVIDIA RTX™ 6000 Ada Generation」,採用最新 Ada Lovelace 架構、升級 CUDA 核心、第三代 RT 核心與第四代 Tensor 核心,並擁有 48GB ECC 視訊記憶體、3 組支援 AV1 的編解碼引擎、虛擬化、Quadro Sync II、RTX Desktop 與企業專屬功能,滿足當代的影像輸出、AI、繪圖、運算等專業工作任務。而專業繪圖卡的銷售與支援服務,則交由 NVIDIA 長期的合作伙伴麗臺科技 LEADTEK 為各位服務。
規格
GPU 架構:NVIDIA Ada Lovelace
CUDA 平行處理核心:18176
NVIDIA Tensor 核心:568
NVIDIA RT 核心:142
單精度效能:91.1 TFLOPS
RT Core 效能:210.6 TFLOPS
Tensor 效能:1457 TFLOPS2
GPU 記憶體:48 GB GDDR6 ECC
記憶體介面:384-bit
記憶體頻寬:960 GB/s
最大功耗:300 W
繪圖匯流排:PCI Express 4.0 x16
顯示連接器:DP 1.4 x4
尺寸:4.4″ H x 10.5″ L 雙寬度
重量:1.18kg
外部電源連接器:1x PCIe 12+4 pin
同步輸出:支援 Quadro Sync II
編解碼引擎:3x encode, 3x decode (+AV1 encode/decode)
幾乎滿血的 AD102 核心 NVIDIA RTX 6000 Ada 世代專業繪圖卡
新一代 NVIDIA Ada Lovelace 架構,帶來更強悍的 CUDA、RT 與 Tensor 等核心的升級,以及意想不到 DLSS 3 的 AI 補幀加速技術,藉由 Optical Flow Accelerator 捕捉像素的方向,對於需要即時光線追蹤渲染的專業應用,可藉助 DLSS 3 的 AI 推論生成 7/8 的影像,大幅提升整體效能。
而 NVIDIA RTX 專業繪圖卡也推出新一代「NVIDIA RTX™ 6000 Ada Generation」,採用 AD102 核心幾乎滿血的 142 組 SM 配置,有著 18176 CUDA、568 Tensor、142 RT 等核心規格,相比 RTX 4090 的 128 組 SM 規格要高了一些。
↑ RTX 6000 Ada Generation 與 RTX 4090 規格比較。
說道 NVIDIA RTX 專業繪圖卡與 GeForce RTX 遊戲顯卡的差異,從規格來看 RTX 6000 具備超大的 48GB GDDR6 記憶體,並支援記憶體 ECC 錯誤修正碼的功能,但相對記憶體頻寬略低於 GR6X 的規格;此外顯卡的 TGP 也降至 300W。
但是,RTX 6000 支援著更多的企業專業應用,像是 RTX 虛擬工作站(vWS)、3 組第五代 NVDEC 解碼引擎與第八代 NVENC 編碼引擎、Mosaic 多顯示器、RTX 桌面管理軟體、Quadro Sync II,以及企業管理工具等。
此外,NVIDIA 專業繪圖卡主要都由合作伙伴銷售,像是麗臺科技銷售的專業繪圖卡產品,享有「三年保固」,保固內提供「到府收送」的服務,並提供「0800-600-206」技術服務專線,能給予企業、客戶完整的技術支援與服務;這也是與遊戲顯卡差異最大的地方。
同時 NVIDIA 提供專業繪圖卡「正式分支 / Studio」與「新功能分支」的驅動分支版本。簡單來說,「正式分支 / Studio」提供最佳穩定性與效能,以及 ISV 認證、較長的生命週期、安全性更新等最穩定的版本;而「新功能分支」則是提供最新的驅動功能、錯誤修正與作業系統支援。
NVIDIA RTX™ 6000 Ada Generation 專業繪圖卡開箱 / 26.7cm 長、2-Slot、鼓風扇工作站設計
NVIDIA RTX 6000 Ada Generation 專業繪圖卡,採用 26.7cm 長、2-Slot 安裝空間、單鼓風扇散熱的工作站設計,畢竟高階工作站、伺服器都有著強勁的散熱氣流替主機散熱,因此專業繪圖卡也維持著相同的散熱氣流設計,而這設計也對多 GPU 擴充更佳友善。
RTX 6000 採用高質感的鏡面黑外殼,側面則有著這代 DGX 的金色邊框,以及 NVIDIA 與 RTX 6000 的字樣。供電接頭則移至顯卡前方,採用單 PCIe 16 pin 12VHPWR 供電。
↑ NVIDIA RTX 6000 Ada Generation 外包裝。
RTX 6000 採用傳統鼓風扇散熱設計,全黑的鏡面表面搭配金圈點綴,而側面的金色邊框與迷人的曲線,讓專業繪圖有著與眾不同的設計感。
顯卡側面左上角則有著 Quadro Sync II 的連接介面。而顯卡的前方,則有著 PCIe 16 pin 12VHPWR 供電插座。
RTX 6000 專業繪圖卡提供 4 個 DisplayPort 1.4 連接埠,同時配件中則有 DP 1.4 轉 HDMI 的接頭可使用。最高可同時輸出 4 個 4K@120Hz 或 5K@60Hz 的專業顯示器,當然也可支援 2 個 8K@60Hz 的超高解析度螢幕輸出。
↑ 配件則有 PCIe 16 pin 12VHPWR 轉 2 個 PCIe 6 pin 轉接頭,以及 DisplayPort 1.4 轉 HDMI 轉接頭。
NVIDIA Control Center、ECC、Mosaic、RTX Desktop
RTX 6000 採用 48GB GDDR6 ECC 記憶體,預設上已啟用 ECC 功能。若要調整則可在 NVIDIA Control Center 將 ECC 狀態設定為關閉。畢竟專業工作的運算、模擬都需要花費長時間進行,因此藉由記憶體的錯誤修正碼 ECC,能為工作站提高計算精確度與可靠性。
對於專業工作站的多 GPU、多螢幕連接情境下,NVIDIA Control Center 也提供 Topology 資訊,從系統驅動版本、專業繪圖卡的 4 個螢幕輸出埠,以及目前正在連接的外接螢幕資訊,讓用戶可以更有效的管理工作站目前使用的 GPU 與外接螢幕。
NVIDIA Mosaic 多顯示器技術,支援最多 4 個 GPU、16 個顯示器的畫面整合,用戶可依據使用環境來排列顯示器,並整合作為單一桌面使用,並提供螢幕邊框校正、投影機重疊等進階的多螢幕整合功能。
RTX 桌面管理軟體,則是更強大的桌面視窗排列、管理的工具軟體,而且可直接在軟體中控制多螢幕內的所有視窗排列,並可將目前的視窗配置儲存為 Profile,並提供預設的幾種 GRID 分割方式,讓多螢幕工作情境可更有效的管理。
↑ RTX 桌面管理軟體,可以直接在軟體中排列每個螢幕的視窗位置。
而在 Control Center 當中也可以調整 GPU 的使用模式,預設是繪圖、運算都會使用的模式,倘若是指做繪圖功能也可切換至專注繪圖任務的 GPU 模式。
NVIDIA RTX™ 6000 Ada Generation 創作、渲染效能測試
效能評估方面則使用專業領域會參考的 SPECviewperf、Blender、Vray 與 OCTANEBENCH 等工具,來測試 RTX 6000 專業繪圖卡的渲染、運算效能,同時也加入 DaVinci Resolve 18 影音輸出測試、Omniverse Creator 與 Stable Diffusion 等測試。
測試平台
處理器:Intel Core i9-13900K
主機板:ASUS ROG MAXIMUS Z790 HERO
記憶體:KLEVV DDR5-7200 16GBx2
顯示卡:NVIDIA RTX™ 6000 Ada Generation
系統碟:Solidigm P41 Plus 1TB PCIe 4.0 SSD
散熱器:NZXT 360mm 水冷
電源供應器:Seasonic VERTEX GX-1000
作業系統:Windows 11 Pro 21H2 64bit、Resizable BAR On
驅動版本:NVIDIA 528.89
GPU-Z 檢視 RTX 6000 資訊,採用 4nm 製程的 AD102 GPU,有著 18176 個渲染 CUDA 核心,以及 46080 MB GDDR6(Samsung)記憶體,而 GPU 預設時脈 915 MHz、Boost 2505 MHz。
DaVinci Resolve 18 純粹通過 GPU 加速的影片剪輯程式,更包含強大的色彩校正與特效功能,並且直接使用 CUDA 核心運算,讓影片剪輯的回放與輸出都有著相當好的性能。
首先第一段測試的專案使用 4K Blackmagic RAW 影像,有著 Wedding_Heavy_Styles 時間軸,這段影片使用非常多的 Resolve 效果,像是 OFX: Light Rays / Glow / Sketch 等,輸出相當高風格的影片類型。
Bride_FaceRefine_Selective_Color 則使用 Face Refinement 做人臉的追蹤,並將主體新娘使用顏色標示;50% Retime 與 Optical Flow Enhanced Better 都使用 Optical Flow 技術降低影像 50% 速度。
SuperScale2x 4K Source 使用 4K ProRES 來源影片製作 2x Zoom In 主體的 4K 影片輸出;SuperScale4x HD_Source 則是使用 HD H.264 來源影片,利用 Resolve Super Scale 輸出成 4K 影片。
RTX 6000 多達 3 組第八代 NVENC 編碼引擎,對於 4K 影音輸出工作有著相當快的處理能力,即便 4 個 HD 拼成 4K 輸出也只需 1 分 10 秒即可完成任務,其餘輸出則都在 1 分鐘之內就完成。
第二段測試為雙 NVENC 編碼的 AV1 與 HEVC 編碼測試,測試專案是一段 44 秒的小短片,來至於 Blender Open Movie Project《Tears of Steel》,並有著 8k Prores442HQ 30FPS 與 4K Prores422HQ 30FPS 的影片,可用來測試輸出為 HEVC、AV1 編碼的效能。
輸出設定主要是使用 NVIDIA Encoder、Quality: Restrict to 80000 Kb/s、Encoding Profile: Main、Rate Control: Constant Bitrate、Preset: Faster、Tuning: High Quality、Two Pass: Disable 等輸出設定。
對於 RTX 6000 來說輸出 4K 專案確實相當輕鬆,而若升級到 8K 影片輸出,不論 HEVC 或 AV1 編碼都能有相當快的輸出效能。
Blender 是跨平台、開放源碼的 3D 創作工具,支援著各種 3D 作業:Modeling、Rigging、Animation、Simulation、Rendering、Compositing 與 Motion Tracking 等。而測試,則以 Blender Benchmark 3.5.0 進行 Demo 專案的渲染工作測試。
Blender Benchmark 測試 RTX 6000 在 monster 場景達到 5643.302 分、junkshop 場景 2614.596 分、classroom 場景 2708.850 分,滿足 3D 創作所需的渲染效能。
V-Ray Benchmark 是由 Chaos Group 所開發,V-Ray 是基於物理法則所設計的光線渲染軟體,而此工具可分別針對 CPU 與 GPU 進行光線追蹤的渲染圖像的運算測試。
V-Ray 測試,RTX 6000 採用 CUDA 運算可達到每秒 3166 vpath 的計算量,而採用 RTX 運算則可達到每秒 3904 vray 的運算效能。
OctaneBench 是快速且獨立的渲染測試工具,其核心為 OTOY Octane Render,可充分利用 RTX 與 CUDA 技術,並支援主流的 3D 應用程式,讓創作者能有著快速高品質的渲染輸出。
測試中包含 4 種場景與 Info channels、direct lighting、path tracing 等核心,RTX 6000 能提供相當可觀的運算速度,滿足創作者所需的快速渲染能力。
SPECviewperf 2020 基於專業應用所開發的標準繪圖效能測試工具,測試各式專業的計算機圖形軟體如:3ds Max、Catia、Creo、Energy、Maya、Medical、SNX、SolidWorks 等繪圖測試與工程模擬。
測試為 3840 x 2160 解析度、成績為 FPS,可見 RTX 6000 在各項工作中都能有著相當高的 FPS 表現,讓專業工作者在創作、模擬、運算時也有足夠的繪圖效能。
Procyon AI Inference 測試,提供多種 AI 引擎的推論測試,並採用常見的神經網路像是 MobileNet、ResNet 50、Inception V4、DeepLab V3、YOLO V3、Real-ESRGAN 來進行推論測試,除了 Procyon 提供的總成績外,也可分別檢視各個推論項目的平均推論時間與推論數量。
RTX 6000 採用 TensorRT 引擎、float32 精度在 MobileNet V3 達到 0.47ms 的推論時間、ResNet 50 平均 1.08ms、Inception V4 平均 3.35ms、DeepLab V3 平均 2.73ms、YOLO V3 平均 2.69ms、Real-ESRGAN 平均 91.57ms 的推論時間。
↑ Procyon AI Inference、TensorRT 引擎、float32 精度。
NVIDIA RTX™ 6000 Ada Generation Omniverse Creator 測試
NVIDIA Omniverse 加速 3D 設計的協作平台,不僅能無縫支援業界主流的 3D apps,讓來自世界各地的創作者能同時創作 3D 專案,並得到即時的渲染效果呈現,更具備 Digital Twin、機器人訓練模擬等功能。
此次測試主要以 Omniverse Create 的專案來進行即時光追渲染、DLSS 3 加速的 FPS 效能測試。測試的專案則包含:Campfire_Main_03_Flow3 模擬營火燃燒的物理效果、Flowers4 測試 Instanced geometry and particle flow animation、Incense_Main 測試煙霧模擬與反射材料變化、JadeTiger 測試場景包含玉的高級材料的細緻模型、Warehouse_Physics_Stage 測試場景則是模擬倉庫貨架倒塌的骨牌效應。
RTX 6000 在 UHD ViewPort 與 DLSS3 Quality 設定下,Campfire 平均 43.87 FPS、Flowers4 平均 38.97 FPS、Incense_Main 平均 61.15 FPS、JadeTiger 平均 27.17 FPS、Warehouse_Physics_Stage 平均 24.24 FPS 的效能表現。
NVIDIA RTX™ 6000 Ada Generation AI 算圖 Stable Diffusion 測試
現在很紅的 AI 深度學習文字到圖像的生成模型 Stable Diffusion,經過手動安裝於 Automatic1111 Web UI 發行的版本,加入最新 cuDNN DLLs 讓 Stable Diffusion 能夠獲得最佳的 GPU 加速效能,藉此來比較 GPU 的 AI 運算能力。
測試的設定與咒語可參考圖片下方說明,通過測試 RTX 6000 可達到每分鐘 17.91 張的圖片生成速度。
NVIDIA RTX™ 6000 Ada Generation 功耗與溫度測量
顯卡的功耗與溫度測試,使用 Omniverse 與 DaVinci Resolve 18 測試的專案運行 3 次後記錄 GPU 溫度與功耗,而最高功耗則藉由 Furmark 來進行燒機測試。功耗測量時使用 NVIDIA 提供的 PACT 工具,可監控 PCIe 插槽與電源 12V 提供的瓦數。
顯卡溫度方面,RTX 6000 最高溫度壓在 83.4°C,Omniverse 3D 渲染則在 75.4°C、DaVinci Resolve 18 的 8K 影音輸出則更低僅 63.9°C 的溫度表現。可見即便標準尺寸的鼓風扇也能替 GPU 帶來不錯的散熱表現。
顯卡 TBP 功耗測試,在 Furmark 壓力測試達到最高 287W 的平均功耗,而 Omniverse 3D 渲染則維持在 263.2W、DaVinci Resolve 18 的 8K 影音輸出僅 150W 的功耗表現。
總結
NVIDIA RTX™ 6000 Ada Generation 專業繪圖卡,有著相當強悍的效能與工作站相容的散熱設計,不論是 DaVinci Resolve 18 的 8K AV1 影音輸出、Omniverse Creator 的即時光追 UHD 模擬渲染、生成式 AI 的 Stable Diffusion 文字推論圖片,都能有著相當出色的效能表現。
RTX 6000 能滿足專業用戶穩定的效能需求,更何況 48GB GDDR6 ECC 記憶體,更可滿足大專案的記憶體使用量,像是 Omniverse 的 Warehouse_Physics_Stage 專案在 QHD Viewport 就佔用 17GB 的視訊記憶體,這記憶體需求絕非一般 GeForce RTX 遊戲顯卡能滿足的需求。
NVIDIA 給予專業用戶完整的軟硬體生態系,像是 GPU 虛擬化、Mosaic、RTX 桌面管理,以及由 NVIDIA 開發的 SDK 軟體工具等整合,橫跨 AI、資料科學、資料中心、雲端、設計、模擬、機器人、高效能運算、自駕車等不同領域,讓各行各業的難題都可通過 GPU 加速迎刃而解。
最後,NVIDIA 的專業繪圖卡產品,由麗臺科技則提供完善的售後服務,不僅享有 3 年到府收送的保固服務,更有著免付費的客服專線「0800-600-206」,提供各領域的專業用戶最安心、穩定的創作、運算體驗。