沒有驚喜!NVIDIA GeForce RTX 5080 顯示卡測試報告 / 世代升級 +15%、DLSS4 +100%
真的超可惜,這刀法還是太小氣了!NVIDIA 新一代 Blackwell 架構、GeForce RTX 50 系列 GPU,RTX 5090 憑著 30% 效能提升、DLSS 4 畫格生成達到 4K 240fps 的高效能,接著輪到 RTX 5080 效能解禁,萬眾期待的它能否贏過上代旗艦,以及相比上一代 RTX 4080 能帶來多少效能提升,就讓我們一邊測試一邊報告了。
內容目錄
明天 RTX 50 系列首發開賣、NVIDIA GeForce RTX 5080 接力解禁
明天 1/30 晚上 22:00 正式開賣的 NVIDIA GeForce RTX 5090 與 RTX 5080 顯示卡,採用最新 RTX Blackwell GPU 架構,針對 Neural Rendering 打造更適合混合渲染、光追、AI 運算的 GPU。至於面向 2K 主流高階玩家的 RTX 5070 Ti 與 RTX 5070 則是 2 月推出。
明日開賣的一大重點是,各個品牌會不會推出非 OC、官方建議售價的型號,以及最終 RTX 5090 與 RTX 5080 開賣時的價格會高於定價多少?
RTX 5090 – 3,400 AI TOPS 美金定價 $1,999 元 / 台幣定價 NT$ 71,990 元
RTX 5080 – 1,800 AI TOPS 美金定價 $999 元 / 台幣定價 NT$ 35,990 元
RTX 5070 Ti – 1,400 AI TOPS 美金定價 $749 元 / 台幣定價 NT$ 26,990 元
RTX 5070 – 1,000 AI TOPS 美金定價 $549 元 / 台幣定價 NT$ 19,990 元。
NVIDIA GeForce RTX 50 世代針對 Neural Rendering 打造的 SM,包含 CUDA 核心、第 4 代 RT Core 支援 Mega Geometry、第 5 代 Tensor Core 加入 FP4 精度可原生支援 FP4/FP8/FP16 等 AI 運算。
以及最重要的 DLSS 4 多畫格生成、負責調度 GPU 負載的 AMP 處理器(獨立硬體支援 Win 11 硬體加速GPU 排程)、以及全面採用 GDDR7 記憶體、PCIe 5.0 等新技術,而且影像編解碼引擎也有著升級,最高 3 個第 9 代編碼、2 個第 6 代解碼引擎。
RTX 5090 與 RTX 5080 雖然採用相同 GB202 核心,但規格有著一定的差距。RTX 5080 直接大刀一砍,直接砍半。RTX 5080 具備 10752 個 CUDA 核心、336 個 Tensor Core 與 84 個 RT Core,預設 GPU Boost 時脈為 2617 MHz,搭配 16GB GDDR7 記憶體、256-bit / 960 GB/s 頻寬、TGP 360W 等規格。
比起上一代 RTX 4090 與 RTX 4080 之間的差距還大一些,因此可推測未來一定會有一張 RTX 5080 Super 或 Ti 的 GPU 更新,但這可能要等上一陣子了。
Blackwell 重點:Neural Rendering、DLSS 4、Transformer、Reflex 2
NVIDIA GeForce RTX 50 系列採用 RTX Blackwell 架構,主要針對 Neural Rendering 打造新一代 SM 流處理器,包含 CUDA 平行運算核心、RT Core 負責光線追蹤與 Tensor Core 處理神經網路運算,並通過 RTX Neural Shaders 讓遊戲引擎可以靠著 AI 獲得更出色的影像材質、材料與光線等表現,而且可以有效降低傳統渲染所需的記憶體使用量。
另一方面,DLSS 4 多畫格生成技術使用 5 個神經網路生成遊戲影像,搭配 Blackwell 硬體的 Flip Metering 確保影像順暢更新,讓遊戲引擎只需渲染 1/16 的畫格,就可以靠著 DLSS 4 生成 15/16 的畫格,帶來 8x 倍的遊戲效能提升。並且是 RTX 50 獨家支援的技術。
至於 DLSS 通過 6 年的不斷學習,在遊戲、渲染運算等應用中大放異彩,而在 RTX 50 推出之際 NVIDIA 也著手將 DLSS 使用的 CNN 模型升級成 Transformers 模型,而這升級是所有 RTX 用戶都能啟用,只要 NVIDIA App 應用開放就能手動 Override 調整 AI 模型設定。
Reflex 2 採用「Frame Warp」新技術,是指當 GPU 已經渲染好影像後隨著滑鼠移動,需要重新渲染整個畫面的空間,但套用「Frame Warp」技術則是直接移動原本渲染好的畫面,並通過前一幀的影像、顏色資料與深度資料,將空白的畫面 InPainting 填滿。可達到 75% 的延遲降低,並且是 DLSS 4 的強制啟用功能。
更完整的「Blackwell 架構 Neural Rendering 全新電腦繪圖世代」,還請參考上篇 RTX 5090 測試報告(https://news.xfastest.com/?p=148374)。
NVIDIA GeForce RTX 5080 創始版顯示卡開箱
RTX 5080 創始版與 RTX 5090 創始版的散熱器相同,差異在於 X 框架的金屬色澤。這代 RTX 50 系列創始版開創「雙穿透氣流」的獨特設計,採用均溫板、熱導管、散熱鰭片與雙風扇,讓創始版僅 304 x 137 mm 與 2-Slot 兩槽厚度,即可帶來出色的散熱能力。
首先外包裝更符合環境友善採用相當低調的紙盒,手撕的封條拆開後就會看到「Inspired by Gamers. Enhanced by AI. Built by NVIDIA.」這句話,這也反映出現在的行業現況,遊戲與玩家密不可分相互啟發與影響,而現代即時光線追蹤或實做全景光線的遊戲,則都需要透過 AI 超解析度、畫格生成等方式強化影像,最後則使用 NVIDIA 打造的 GPU 執行遊戲。
↑ Inspired by Gamers. Enhanced by AI. Built by NVIDIA。
接著將 RTX 5090(左)與 RTX 5080(右)一起拍攝,GeForce RTX 5080 FE 創始版,開創獨特的「雙穿透氣流」的設計,外觀與上一代 RTX 4090 創始版有點像,維持著獨特的 X 框架與全金屬材料打造,但整體線條更佳圓潤有細節,兩組大面積的散熱鰭片縝密排列。
顯卡正面,則有著兩顆 11.5cm、軸向式風扇,藉由縮短置中的電路板,讓兩顆風扇的氣流可穿透顯示卡。但也多增加底部 PCIe 電路板與後方顯示輸出電路板,通過強化的結構設計滿足高頻寬的連接需求,並確保顯卡水平安裝時的強度。
↑ RTX 5090(左)與 RTX 5080(右)創始版差異在於 X 框架的金屬色澤。
顯卡側面,則有著 90° 斜開的 PCIe 12V-2×6 供電接頭,會這樣設計主要是可以節省電路板佔用空間,搭配原生線材連接時也可比較容易走線,但相對的比較容易遮住側面的 GEFORCE RTX 字樣燈效。
↑ RTX 5090 使用 PCIe 5.0 x16 介面。
RTX 50 系列創始版提供的是新版「PCIe 12V-2×6 柔軟編織 PCIe 8pin 轉接線」,RTX 5090 需要使用 4 個 PCIe 8pin 轉 PCIe 12V-2×6。而新版接頭的編織線柔軟度相當高,且在接頭處還多了一層保護,確保玩家裝機理線時不會影響接頭的密合度。
↑ PCIe 12V-2×6 柔軟編織 PCIe 8pin 轉接線。
NVIDIA GeForce RTX 5080 創作影音輸出、GPU 渲染效能測試
此次測試包含創作 DaVinci Resolve 19、Procyon AI 生成、Blender 與 V-Ray 等創作測試,遊戲則以 2160p、1440p 解析度、特效全開測試電競、AAA 遊戲與光追遊戲的效能,並將 DLSS 4 單獨測試,讓玩家更能瞭解 RTX 5080 相比前一代 RTX 4080 的效能提升,以及能不能越級與 RTX 4090 一拼高下。
↑ 測試使用 FSP MEGA Ti 1650W 電源供應器。
測試平台
處理器:AMD Ryzen 7 9800X3D
主機板:ROG CROSSHAIR X870E HERO
記憶體:G.Skill DDR5-6000 16GBx2
顯示卡:NVIDIA GeForce RTX 5090、RTX 5080、RTX 4090、RTX 4080
系統碟:Solidigm P44 Pro 1TB PCIe 4.0 SSD
散熱器:ROG RYUJIN II 360
電源供應器:FSP MEGA Ti 1650W
作業系統:Windows 11 Pro 24H2 64bit、Resizable BAR On
驅動版本:NVIDIA 572.02
GPU-Z 還未能檢視 NVIDIA GeForce RTX 5080 資訊,採用 4nm 製程的 GB202 GPU,有著 10752 個渲染 CUDA 核心,以及 16303 MB GDDR7(Micron)記憶體,而 GPU 預設時脈 2295 MHz、Boost 2617 MHz。
DaVinci Resolve 19 純粹通過 GPU 加速的影片剪輯程式,更包含強大的色彩校正與特效功能,並且直接使用 CUDA 核心運算,讓影片剪輯的回放與輸出都有著相當好的性能。測試版本已支援 RTX 50 的 4:2:2 編碼比率。
測試專案是一段 44 秒的小短片,來至於 Blender Open Movie Project《Tears of Steel》,並有著 8k Prores442HQ 30FPS 與 4K Prores422HQ 30FPS 的影片,可用來測試輸出 HEVC 4:4:4 與 4:2:2 的編碼效能差異。
RTX 5080 有著 2 組 NVENC 編碼引擎,在處理 8K30 H.265 4:4:4 編碼輸出時,需要 2 分 2 秒的時間;相比 RTX 5090 慢 5 秒,但比起 RTX 4080 快了 13 秒。
此外,上一代 RTX 4090 與 RTX 4080 不支援 4:2:2 原生輸出,因此若影音工作主力是 4:2:2 的編碼比,那新一代 RTX 5090 與 RTX 5080 確實有著更多優勢。
Blender 是跨平台、開放源碼的 3D 創作工具,支援著各種 3D 作業:Modeling、Rigging、Animation、Simulation、Rendering、Compositing 與 Motion Tracking 等。而測試,則以 Blender Benchmark 3.3.0 進行 Demo 專案的渲染工作測試。
Blender Benchmark 4.3.0 測試,RTX 5080 在三個場景的測試中,每分鐘 Sample 數量約是上一代 RTX 4080 的 9% 提升,但比起 RTX 5090 渲染效能約降低 -39%、相比 RTX 4090 則是 -18%。
V-RAY 6 Benchmark 是由 Chaos Group 所開發,V-Ray 是基於物理法則所設計的光線渲染軟體,而此工具可分別針對 CPU 與 GPU 進行光線追蹤的渲染圖像的運算測試。
通過 RTX 運算,RTX 5080 達到 9307 vpaths 的每分鐘光線運算量,相比上一代 RTX 4080 有著 24% 的效能提升,但比起 RTX 5090 渲染效能約降低 -39%、相比 RTX 4090 則是 -16%。
NVIDIA GeForce RTX 5080 – 生成式 AI 測試 IMG、LLM
UL Procyon AI Image Generation Benchmark 提供 Stable Diffusion XL (FP16) 與 Stable Diffusion 1.5 (FP16) 的兩種測試情境,並支援 ONNX runtime with DirectML、NVIDIA TensorRT 與 Intel OpenVINO 的推論引擎。
測試版本目前 Stable Diffusion 還未支援 TensorRT 引擎,並提供新的 FLUX.1 模型支援 FP8 與 FP4 精度與 TensorRT 引擎,可以用來測試新一代 RTX 50 支援原生 FP4 精度的運算效能。上一代或其餘 RTX GPU,一樣可運算 FP4 精度但相對更耗費硬體效能。
RTX 5080 在主流的 Stable Diffusion XL (FP16) 測試中,生成一張圖片需要 12s 秒;改用 FLUX.1 FP8 精度,RTX 5080 需要 14s 秒生成影像;至於原生 FP4 精度運算、FLUX.1 FP4 測試 RTX 5080 只需 8.9s 秒即可完成任務。
RTX 5080 在生成式 AI 圖形測試上,相比上一代 RTX 4080 約提升 25% 的效能,但在原生支援 FP4 精度下可有著 70% 的領先;但比起 RTX 5090 的 AI 效能約降低 -40% 以上、並也小輸給 RTX 4090 約 -22%,但支援 FP4 精度情況下則可反超 49% 的效能。
UL Procyon AI Text Generation Benchmark 提供 ONNX 模型包含 Phi-3.5-mini、Llama-3.1-8B、Mistral-7B 與 Llama-2-13B 測試,每個模型測試 7 個 Prompts 包含 RAG 與非 RAG 的查詢,通過權重後的總分與平均 Time To First Token(TTFT)、平均 Output Token Speed(OTS)提供專業用戶橫量電腦的 AI LLM 推論效能。
RTX 5080 在 4 個 LLM 測試下都有著不錯的成績,相比上一代 RTX 4080 約提升 22% 的效能,但輸給 RTX 5090 約 -28% 的效能,同樣小輸給 RTX 4090 約 -8%。
NVIDIA GeForce RTX 5080 – 3DMark 跑分效能測試
3DMark Fire Strike 繪圖效能測試,為主流的 DirectX 11 API 的測試情境,分別測試 1080p、Extreme 1440p 與 Ultra 2160p 的效能。3DMark Time Spy 則是採用 DirectX 12 API 所設計的測試情境,同樣是鎖定在 AAA 遊戲等級,分別測試 1440p 與 Extreme 2160p 的效能。
RTX 5080 在 Fire Strike 繪圖達到 79937 分、Extreme 42008 分、Ultra 21531 分的成績。至於 Time Spy 繪圖成績,RTX 5080 獲得 32424 與 Extreme 16254 分。
RTX 5080 在 3DMark 繪圖測試上,相比上一代 RTX 4080 在 Fire Strike 提升 24%、Time Spy 提升 17% 的效能。但比起 RTX 5090 的效能分別降低 -30%、-35%;若是與 RTX 4090 相比也分別降低 -9%、-13%。
↑ 3DMark Fire Strike、Time Spy 測試。
3DMark 光線追蹤場景測試,像是最早推出的 Port Royal 在 AAA 遊戲中的場景中加入光線追蹤功能,考驗著新一代 GPU 對於硬體光線追蹤加速的能力;以及單獨測試 DirectX Raytracing API 的 DXR 功能測試;最後 Speed Way 則是使用全光線追蹤所開發的測試情境。
(目前確定測試驅動的 DXR 效能異常)
RTX 5080 在 Speed Way 達到 89.5 FPS、Port Royal 103.31 FPS 的光追效能,這是未開啟 DLSS 加速的原生效能。
RTX 5080 在 3DMark 光追情境測試上,相比上一代 RTX 4080 有著 23% 提升。但比起 RTX 5090 的效能降低 -38%;若是與 RTX 4090 相比也降低 -14%。
3DMark DLSS Feature Test 可針對 DLSS 4、DLSS 3 與 DLSS 2 進行效能測試,設定為 3840 x 2160、Performance 加速。
RTX 5080 原生 49.14 FPS,通過 DLSS 4 多畫格生成可達到 292.41 FPS,足足 5.9x 倍的效能提升;而比較有趣的是 RTX 4090 與 RTX 4080 在 DLSS 4 測試下,效能相比 DLSS 3 有著 10% 的提升,這點有可能要歸功於 Transformer 模型。
NVIDIA GeForce RTX 5080 – 4 款電競遊戲效能測試
4 款電競遊戲《虹彩六號:圍攻行動》、《英雄聯盟》、《APEX 英雄》與《Counter-Strike 2》等,都是重技巧、團隊的戰術競技射擊、DOTA 類型的遊戲,因此遊戲畫質、細節不高的狀況下,遊戲 FPS 也都是平均百幀以上的表現。測試以 2160p / 1440p、特效最高設定進行。
RTX 5080 在 2160p 解析度下,CS2 平均 211.1 FPS、APEX 平均 279 FPS、英雄聯盟平均 548 FPS、R6 平均 354 FPS。這效能一樣可滿足電競玩家的 4K 240 FPS 的高效能需求。至於 1440p 狀況相同。
NVIDIA GeForce RTX 5080 – 8 款遊戲效能測試
8 款 AAA 遊戲平均效能,同樣測試 2160p / 1440p 特效全開進行測試,這段測試不開啟光追功能與任何超解析度加速,主要測試 GPU 的實際傳統渲染遊戲效能。
遊戲測試名單有《F1® 24》、《古墓奇兵:暗影》、《地平線:期待黎明》,以及吃重效能的《邊緣禁地 3》、《碧血狂殺 2》、《刺客教條:維京紀元》、《戰神》與新加入的《流亡黯道 2》等測試。
RTX 5080 在 2160p、不追光不加速的 AAA 遊戲中達到平均 131.8 FPS,效能依舊相當強大,做為主流 4K 遊戲顯卡也不成問題。
RTX 5080 在 2160p、AAA 遊戲測試上,相比上一代 RTX 4080(平均 114.3 FPS)約提升 15% 的效能;但比起 RTX 5090(平均 197.2 FPS)約降低 -33% 的效能;以及小輸給 RTX 4090(平均 154.1 FPS)約降低 -14% 的效能。
至於 RTX 5080 在 1440p 解析度下平均 210 FPS。相比上一代 RTX 4080(平均 184.8 FPS)約提升 14% 的效能;但比起 RTX 5090(平均 265.7 FPS)約降低 -21% 的效能;以及小輸給 RTX 4090(平均 234.3 FPS)約降低 -10% 的效能。
↑ AAA 遊戲 2160p,不開光追、不開超解析度、不開畫格生成測試。
↑ AAA 遊戲 1440p,不開光追、不開超解析度、不開畫格生成測試。
NVIDIA GeForce RTX 5080 – 8 款光追遊戲測試
8 款光追 DXR 遊戲測試,使用 2160p / 1440p 解析度,特效 / 光追最高設定外,也會啟用 DLSS 3 加速、畫格生成等設定,但為了更好單獨比較 RTX 5090 與 RTX 4090 的升級效能,因此將 DLSS 4 畫格生成獨立測試,詳細設定請參考圖表說明。
測試遊戲有《暗黑破壞神 IV》、《阿凡達:潘朵拉邊境》、《極地戰嚎 6》、《漫威星際異攻隊》、《電馭叛客 2077》、《巫師 3:狂獵》、《印第安納瓊斯:古老之圈》與《黑神話:悟空》等遊戲。
RTX 5080 在 2160p、光追、DLSS 3 加速的遊戲中達到平均 132.6 FPS。《電馭叛客 2077》平均 153.4 FPS、《印第安納瓊斯:古老之圈》平均 112 FPS 與《黑神話:悟空》平均 88 FPS,面對光追大作依舊有著足夠的效能。
RTX 5080 在 2160p、光追遊戲測試上,相比上一代 RTX 4080(平均 115.6 FPS)約提升 15% 的效能;但比起 RTX 5090(平均 183.5 FPS)約降低 -28% 的效能;以及小輸給 RTX 4090(平均 145.6 FPS)約降低 -9% 的效能。
至於 RTX 5080 在 1440p 解析度下平均 199.5 FPS。相比上一代 RTX 4080(平均 177 FPS)約提升 13% 的效能;但比起 RTX 5090(平均 243.4 FPS)約降低 -18% 的效能;以及小輸給 RTX 4090(平均 207.7 FPS)約降低 -4% 的效能。
↑ 光追遊戲 2160p,開起光追、超解析度與畫格生成測試。
↑ 光追遊戲 1440p,開起光追、超解析度與畫格生成測試。
NVIDIA GeForce RTX 5080 – DLSS 4 多畫格生成效能實測
目前效能解禁時能測試的遊戲與應用不多,但 NVIDIA 承諾 Day-0 會有 75 款遊戲支援。這段測試主要以 2160p 解析度、特效最高、全開光追的設定,並分別比較原生效能與 DLSS 4 加速後的效能表現,使用 D5 Render、《漫威爭鋒》、《霍格華茲的傳承》、《Alan Wake 2》(全光追)與《電馭叛客 2077》(全光追)進行測試。
RTX 5080 在 D5 Render 原生僅 14 FPS,通過 SR、RR 與 DLSS 4 提升至 49 FPS 約 3.5x 倍提升;《漫威爭鋒》則是原生 69 FPS、DLSS 4 加速 314 FPS 約 4.55x 倍提升;《霍格華茲的傳承》原生 57 FPS、DLSS 4 加速 231 FPS 約 4x 倍提升。
其中提升最多的莫過於使用全光追的遊戲,《Alan Wake 2》原生 17 FPS、DLSS 4 加速至 159 FPS 約 9.35x 倍提升;《電馭叛客 2077》原生 19.5 FPS、DLSS 4 加速 186.1 FPS 約 9.54x 倍效能提升。
簡單來說,RTX 5080 靠著 DLSS 4 提升,可以狠狠海放上一代 RTX 4090 旗艦有著 55% 效能提升,若是對比 RTX 4080 則有著 105% 的效能爆增。
NVIDIA GeForce RTX 5080 功耗與溫度測量
顯卡的功耗與溫度測試,使用 Speed Way Stress test、Furmark2 與《電馭叛客 2077》進行測試。功耗測量時使用 NVIDIA 提供的 PACT 工具,可監控 PCIe 插槽與電源 12V 提供的瓦數。
顯卡溫度方面,RTX 5080 創始版在壓力測試最高溫維持在 74.8°C,而 GDDR7 記憶體溫度最高則在 82°C,至於 2077 遊戲時溫度則會稍微降低 67.9°C。RTX 5080 功耗較低的情況下,理當比起 RTX 5090 還要低溫,但相比上一代三槽厚度的設計,這代 GPU 溫度表現還算合理。
功耗方面,RTX 50 與 RTX 40 世代都採用相同的製程,RTX 5080 功耗最高來到 371W,普遍測試都比上代同級 RTX 4080 高出 40-70W,但有趣的是 2077 遊戲測試時 RTX 5080 功耗僅 291W 與 RTX 4080 相同。
總結
沒有驚喜!他就是 GeForce RTX 5080。RTX 5080 同樣能夠滿足旗艦 4K 遊戲玩家的效能需求,在 8 款 AAA 遊戲平均 132 FPS、8 款光追 DLSS 3 加速遊戲平均 133 FPS,更在 DLSS 4 多畫格生成加速下達到平均 223 FPS 的超高性能。
簡單來說,RTX 5080 比起上一代同級約提升 15% 的遊戲效能(AAA 與光追加速遊戲相同),輸給 RTX 5090 則是 -30% 的遊戲效能,最可惜的是只小輸給上代旗艦 RTX 4090 約 -12% 的遊戲效能。有此可見,RTX 5080 若對比 RTX 4080 Super 那效能差異則更小。
就目前來看,RTX 5090 無疑是零售端最強的顯示卡,不論是影音創作、3D 渲染、生成式 AI 等專業應用都能輕鬆滿足(因為在上一階就沒有零售端的產品了)。當然 RTX 5090 也非常適合遊戲使用,只不過玩家的預算、功耗都要加非常多。
至於 RTX 5080 大砍一半的規格後,一樣能滿足 4K 100 FPS 以上的效能需求,相比上一代 RTX 4080 更顯得遊刃有餘,而且面對全光追(路徑追蹤)等遊戲,一樣能給予相當出色的遊戲效能,但相對的目前 RTX 5080 的定價 NT$ 35,990 元,勢必會比還在賣的 RTX 4080 Super 貴一些,最終有可能達到 4 萬的門檻。
對於遊戲玩家來說,若已經是 RTX 40 系列的用戶升級至 RTX 50,這升級的體感可能不太明顯,除非遊戲都已更新至 DLSS 4 多畫格生成技術,才能有著翻倍升級的感受。但若是還在使用 RTX 20、30 系列無法開啟 DLSS FG 畫格生成的老玩家,那以相同預算或多加一點預算上至 RTX 50 確實能享受大幅升級的快感。(期待二月的 RTX 5070 系列能有多點驚喜。)
What If…? RTX 5080 若能在遊戲(光追 + DLSS 3)贏過 RTX 4090,在渲染、AI 等效能小輸的情況下,或許能讓玩家感受到 NVIDIA 的誠意,但這結果來看可能要等未來 RTX 5080 Super 或 Ti 才有可能了。