我要打 4090!NVIDIA GeForce RTX 5070 顯卡測試報告 / DLSS4 救救我
RTX 5070:「你才是挑戰者喔哦!」NVIDIA 在 CES Keynote 發表會上,重磅宣布新一代 GeForce RTX 5070 的遊戲效能可媲美上一代旗艦 RTX 4090,這消息讓不少玩家眼睛為之一亮,但這也是受惠於 DLSS 4 的 AI 4x 四倍畫格生成技術才能辦到的事;而 RTX 5070 較適合做為 2K 主力遊戲卡,或者搭配 DLSS 3 成為新一代 4K 入門遊戲卡,以及 DLSS 4 滿足 4K 全光追遊戲體驗。
內容目錄
主流 2K、入門 4K 的 NVIDIA GeForce RTX 5070
台幣 2 萬以內的新卡希望 GeForce RTX 5070,做為主流 2K、入門 4K 與 DLSS 4 全光追的遊戲顯示卡,採用 RTX Blackwell 架構 GB205 GPU,具備 6144 個 CUDA 核心、192 個 Tensor Core 與 48 個 RT Core,預設 GPU Boost 時脈為 2512 MHz,搭配 12GB GDDR7 記憶體、192-bit / 672 GB/s 頻寬、顯卡功耗 TGP 250W 等規格。
RTX 5070 相比上一代 RTX 4070 規格,主要 CUDA 核心數提升 4%,相同 12GB 的視訊記憶體容量,但升級至頻寬較高的 GDDR7 記憶體。但同樣的 RTX 5070 美金定價 $549 元,比上一代 RTX 4070 定價 $599 美元便宜 50 美元,至於台灣建議售價為 NT$ 19,990 元起。
NVIDIA 將在 3/5 日推出 RTX 5070,但同時會遇上對手 AMD 的 Radeon 9070 系列的價格戰打擊,這就留待到時在與各位玩家分享;這篇還是以 RTX 5070 的效能,以及對比上一代 RTX 4070 與 RTX 4090 來比較。
RTX 5090 – 3,400 AI TOPS 美金定價 $1,999 元 / 台幣定價 NT$ 71,990 元
RTX 5080 – 1,800 AI TOPS 美金定價 $999 元 / 台幣定價 NT$ 35,990 元
RTX 5070 Ti – 1,400 AI TOPS 美金定價 $749 元 / 台幣定價 NT$ 26,990 元
RTX 5070 – 1,000 AI TOPS 美金定價 $549 元 / 台幣定價 NT$ 19,990 元
Blackwell 重點:Neural Rendering、DLSS 4、Transformer、Reflex 2
NVIDIA GeForce RTX 50 系列採用 RTX Blackwell 架構,主要針對 Neural Rendering 打造新一代 SM 流處理器,包含 CUDA 平行運算核心、RT Core 負責光線追蹤與 Tensor Core 處理神經網路運算,並通過 RTX Neural Shaders 讓遊戲引擎可以靠著 AI 獲得更出色的影像材質、材料與光線等表現,而且可以有效降低傳統渲染所需的記憶體使用量。
另一方面,DLSS 4 多畫格生成技術使用 5 個神經網路生成遊戲影像,搭配 Blackwell 硬體的 Flip Metering 確保影像順暢更新,讓遊戲引擎只需渲染 1/16 的畫格,就可以靠著 DLSS 4 生成 15/16 的畫格,帶來 8x 倍的遊戲效能提升。並且是 RTX 50 獨家支援的技術。
至於 DLSS 通過 6 年的不斷學習,在遊戲、渲染運算等應用中大放異彩,而在 RTX 50 推出之際 NVIDIA 也著手將 DLSS 使用的 CNN 模型升級成 Transformers 模型,而這升級是所有 RTX 用戶都能啟用,只要 NVIDIA App 應用開放就能手動 Override 調整 AI 模型設定。
Reflex 2 採用「Frame Warp」新技術,是指當 GPU 已經渲染好影像後隨著滑鼠移動,需要重新渲染整個畫面的空間,但套用「Frame Warp」技術則是直接移動原本渲染好的畫面,並通過前一幀的影像、顏色資料與深度資料,將空白的畫面 InPainting 填滿。可達到 75% 的延遲降低,並且是 DLSS 4 的強制啟用功能。
更完整的「Blackwell 架構 Neural Rendering 全新電腦繪圖世代」,還請參考上上篇 RTX 5090 測試報告(https://news.xfastest.com/?p=148374)。
NVIDIA GeForce RTX 5070 創始版顯示卡開箱
NVIDIA GeForce RTX 5070 創始版體積稍微縮小,顯卡長度 24.3cm、寬度 9.7cm、同樣佔用 2-slot 插槽的安裝空間,相比 RTX 5090 / 5080 創始版更適合迷你主機 SFF 安裝。RTX 5070 創始版維持著「雙穿透氣流」的獨特設計,採用電路板置中、搭配均溫板、熱導管、散熱鰭片與雙風扇,讓創始板無須厚重的散熱鰭片,也可壓制這代 RTX 50 GPU 的溫度。
創始板外包裝更符合環境友善採用相當低調的紙盒,手撕的封條拆開後就會看到「Inspired by Gamers. Enhanced by AI. Built by NVIDIA.」這句話,這也反映出現在的行業現況,遊戲與玩家密不可分相互啟發與影響,而現代即時光線追蹤或實做全景光線的遊戲,則都需要透過 AI 超解析度、畫格生成等方式強化影像,最後則使用 NVIDIA 打造的 GPU 執行遊戲。
↑ Inspired by Gamers. Enhanced by AI. Built by NVIDIA。
GeForce RTX 5070 FE 創始版,體積稍微縮但維持著「雙穿透氣流」的設計,一樣有著獨特的 X 框架與全金屬材料打造,整體線條更佳圓潤有細節,兩組縝密的散熱鰭片。顯卡正面,則有著兩顆 9cm 軸向式風扇,藉由置中的電路板,讓兩顆風扇的氣流可穿透顯示卡。
↑ 顯卡側面,則有著 90° 斜開的 PCIe 12V-2×6 供電接頭。
顯示輸出則提供 3 個 DisplayPort v2.1b 與 HDMI 2.1b,HDMI 支援 4K 480Hz / 8K 120Hz DSC 與 VRR、HDR 等功能。
RTX 50 系列創始版提供的是新版「PCIe 12V-2×6 柔軟編織 PCIe 8pin 轉接線」,RTX 5070 需要使用 2 個 PCIe 8pin 轉 PCIe 12V-2×6。而新版接頭的編織線柔軟度相當高,且在接頭處還多了一層保護,確保玩家裝機理線時不會影響接頭的密合度。
↑ PCIe 12V-2×6 柔軟編織 PCIe 8pin 轉接線。
最後送上 RTX 5070 與 RTX 5090 創始版的顯卡比較。
NVIDIA GeForce RTX 5070 創作影音輸出、GPU 渲染效能測試
此次測試包含創作 DaVinci Resolve 19、Procyon AI 生成、Blender 與 V-Ray 等創作測試,遊戲則以 2160p、1440p 解析度、特效全開測試電競、AAA 遊戲與光追遊戲的效能,並將 DLSS 4 單獨測試,讓玩家更能瞭解 RTX 5070 相比前一代 RTX 4070 的效能提升,並搭配 RTX 5080 與 RTX 5090 效能,讓玩家能瞭解這代 GPU 的效能差異。
測試平台
處理器:AMD Ryzen 7 9800X3D
主機板:ROG CROSSHAIR X870E HERO
記憶體:G.Skill DDR5-6000 16GBx2
顯示卡:NVIDIA GeForce RTX 5070、RTX 4070
系統碟:Solidigm P44 Pro 1TB PCIe 4.0 SSD
散熱器:ROG RYUJIN II 360
電源供應器:FSP MEGA Ti 1650W
作業系統:Windows 11 Pro 24H2 64bit、Resizable BAR On
驅動版本:NVIDIA 572.50
GPU-Z 可檢視 NVIDIA GeForce RTX 5070 資訊,採用 4nm 製程的 GB205 GPU,有著 6144 個渲染 CUDA 核心,以及 12288 MB GDDR7(SAMSUNG)記憶體,而 GPU 預設時脈 2325 MHz、Boost 2512 MHz。
DaVinci Resolve 19 純粹通過 GPU 加速的影片剪輯程式,更包含強大的色彩校正與特效功能,並且直接使用 CUDA 核心運算,讓影片剪輯的回放與輸出都有著相當好的性能。測試版本已支援 RTX 50 的 4:2:2 編碼比率。
測試專案是一段 44 秒的小短片,來至於 Blender Open Movie Project《Tears of Steel》,並有著 8k Prores442HQ 30FPS 與 4K Prores422HQ 30FPS 的影片,可用來測試輸出 HEVC 4:4:4 與 4:2:2 的編碼效能差異。
RTX 5070 僅只有 1 組 NVENC 編碼引擎,在處理 8K30 H.265 4:4:4 編碼輸出時,需要 2 分 47 秒的時間;相比 RTX 4070 慢 11 秒。若是影音工作需求,建議 RTX 5070 Ti 以上的型號。
Blender 是跨平台、開放源碼的 3D 創作工具,支援著各種 3D 作業:Modeling、Rigging、Animation、Simulation、Rendering、Compositing 與 Motion Tracking 等。而測試,則以 Blender Benchmark 3.3.0 進行 Demo 專案的渲染工作測試。
Blender Benchmark 4.3.0 測試,RTX 5070 在三個場景的測試中,每分鐘 Sample 數量約是上一代 RTX 4070 的 21% 提升,但比起 RTX 5070 Ti 渲染效能約降低 -18%。
V-RAY 6 Benchmark 是由 Chaos Group 所開發,V-Ray 是基於物理法則所設計的光線渲染軟體,而此工具可分別針對 CPU 與 GPU 進行光線追蹤的渲染圖像的運算測試。
通過 RTX 運算,RTX 5070 達到 5889 vpaths 的每分鐘光線運算量,相比上一代 RTX 4070 有著 30% 的效能提升,但比起 RTX 5070 Ti 渲染效能約降低 -27%。
NVIDIA GeForce RTX 5070 – 生成式 AI 測試 IMG、LLM
UL Procyon AI Image Generation Benchmark 提供 Stable Diffusion XL (FP16) 與 Stable Diffusion 1.5 (FP16) 的兩種測試情境,並支援 ONNX runtime with DirectML、NVIDIA TensorRT 與 Intel OpenVINO 的推論引擎。
測試版本目前 Stable Diffusion 還未支援 TensorRT 引擎,並提供新的 FLUX.1 模型支援 FP8 與 FP4 精度與 TensorRT 引擎,可以用來測試新一代 RTX 50 支援原生 FP4 精度的運算效能。上一代或其餘 RTX GPU,一樣可運算 FP4 精度但相對更耗費硬體效能。
RTX 5070 目前在主流的 Stable Diffusion XL (FP16)、ONNX 測試中,因為記憶體不足而無法完成任務,但是上一代 RTX 4070 卻還是能完成任務,這就留待日後軟體更新解決了。
至於在 FLUX.1 FP4 精度上,RTX 5070 也只需要 13s 秒即可生成圖片。
UL Procyon AI Text Generation Benchmark 提供 ONNX 模型包含 Phi-3.5-mini、Llama-3.1-8B、Mistral-7B 與 Llama-2-13B 測試,每個模型測試 7 個 Prompts 包含 RAG 與非 RAG 的查詢,通過權重後的總分與平均 Time To First Token(TTFT)、平均 Output Token Speed(OTS)提供專業用戶橫量電腦的 AI LLM 推論效能。
RTX 5070 在 4 個 LLM 測試下都有著不錯的成績,相比上一代 RTX 4070 約提升 16% 的效能,但輸給 RTX 5070 Ti 約 -25% 的效能。
NVIDIA GeForce RTX 5070 – 3DMark 跑分效能測試
3DMark Fire Strike 繪圖效能測試,為主流的 DirectX 11 API 的測試情境,分別測試 1080p、Extreme 1440p 與 Ultra 2160p 的效能。3DMark Time Spy 則是採用 DirectX 12 API 所設計的測試情境,同樣是鎖定在 AAA 遊戲等級,分別測試 1440p 與 Extreme 2160p 的效能。
RTX 5070 在 Fire Strike 繪圖達到 57676 分、Extreme 28969 分、Ultra 14291 分的成績。至於 Time Spy 繪圖成績,RTX 5070 獲得 22254 與 Extreme 10661 分。
RTX 5070 在 3DMark 繪圖測試上,相比上一代 RTX 4070 在 Fire Strike 提升 37%、Time Spy 提升 26% 的效能。但比起 RTX 5070 Ti 的效能分別降低 -20%、-21%。
↑ 3DMark Fire Strike、Time Spy 測試。
3DMark 光線追蹤場景測試,像是最早推出的 Port Royal 在 AAA 遊戲中的場景中加入光線追蹤功能,考驗著新一代 GPU 對於硬體光線追蹤加速的能力;以及單獨測試 DirectX Raytracing API 的 DXR 功能測試;最後 Speed Way 則是使用全光線追蹤所開發的測試情境。
RTX 5070 在 Speed Way 達到 58.24 FPS、Port Royal 65.12 FPS 的光追效能,這是未開啟 DLSS 加速的原生效能。
RTX 5070 在 3DMark 光追情境測試上,相比上一代 RTX 4070 有著 21% 提升。但比起 RTX 5070 Ti 的效能降低 -27%。
3DMark DLSS Feature Test 可針對 DLSS 4、DLSS 3 與 DLSS 2 進行效能測試,設定為 3840 x 2160、Performance 加速。
RTX 5070 原生 30.32 FPS,通過 DLSS 4 多畫格生成可達到 194.18 FPS,足足 6x 倍的效能提升。
NVIDIA GeForce RTX 5070 – 4 款電競遊戲效能測試
4 款電競遊戲《虹彩六號:圍攻行動》、《英雄聯盟》、《APEX 英雄》與《Counter-Strike 2》等,都是重技巧、團隊的戰術競技射擊、DOTA 類型的遊戲,因此遊戲畫質、細節不高的狀況下,遊戲 FPS 也都是平均百幀以上的表現。測試以 2160p / 1440p、特效最高設定進行。
RTX 5070 在主力 1440p 解析度下,CS2 平均 267.8 FPS、APEX 平均 287 FPS、英雄聯盟平均 532 FPS、R6 平均 434 FPS。當然這效能表現上至 4K 電競也不成問題。
解析度提升至 2160p,RTX 5070 在 CS2 平均 147.4 FPS、APEX 平均 186 FPS、英雄聯盟平均 511 FPS、R6 平均 248 FPS。對於電競遊戲這效能也非常足夠滿足 4K 100 FPS 的效能要求。
NVIDIA GeForce RTX 5070 – 8 款遊戲效能測試
8 款 AAA 遊戲平均效能,同樣測試 2160p / 1440p 特效全開進行測試,這段測試不開啟光追功能與任何超解析度加速,主要測試 GPU 的實際傳統渲染遊戲效能。
遊戲測試名單有《F1® 24》、《古墓奇兵:暗影》、《地平線:期待黎明》,以及吃重效能的《邊緣禁地 3》、《碧血狂殺 2》、《刺客教條:維京紀元》、《戰神》與新加入的《流亡黯道 2》等測試。
RTX 5070 在 1440p、不追光不加速的 AAA 遊戲中達到平均 148.6 FPS;而在 2160p 解析度下平均則達到 87.6 FPS,無疑可做為新一代入門 4K 遊戲顯卡。
RTX 5070 在 1440p、AAA 遊戲測試上,相比上一代 RTX 4070(平均 124.3 FPS)約提升 20% 的效能;比起 RTX 5070 Ti(平均 187.5 FPS)約降低 -21% 的效能。
至於 2160p 解析度下 RTX 5070 相比上一代 RTX 4070(平均 72.9 FPS)約提升 20% 的效能;但比起 RTX 5070 Ti(平均 114.2 FPS)約降低 -23% 的效能。
↑ AAA 遊戲 1440p,不開光追、不開超解析度、不開畫格生成測試。
↑ AAA 遊戲 2160p,不開光追、不開超解析度、不開畫格生成測試。
NVIDIA GeForce RTX 5070 – 7 款光追遊戲測試
7 款光追 DXR 遊戲測試,使用 2160p / 1440p 解析度,特效 / 光追最高設定外,也會啟用 DLSS 3 加速、畫格生成等設定,但為了更好單獨與上代 GPU 比較,因此將 DLSS 4 畫格生成獨立測試,詳細設定請參考圖表說明。
測試遊戲有《暗黑破壞神 IV》、《阿凡達:潘朵拉邊境》、《極地戰嚎 6》、《漫威星際異攻隊》、《電馭叛客 2077》、《巫師 3:狂獵》與《黑神話:悟空》等遊戲。
RTX 5070 在 1440p、光追、DLSS 3 加速的遊戲中達到平均 146.4 FPS。《電馭叛客 2077》平均 170 FPS、《巫師 3:狂獵》平均 147 FPS 與《黑神話:悟空》平均 93 FPS。
RTX 5070 在 1440p、光追遊戲測試上,相比上一代 RTX 4070(平均 122.1 FPS)約提升 20% 的效能;但比起 RTX 5070 Ti(平均 185.3 FPS)約降低 -21% 的效能。
至於 RTX 5070 在 2160p 解析度下平均 96.2 FPS。相比上一代 RTX 4070(平均 77.2 FPS)約提升 25% 的效能;但比起 RTX 5070 Ti(平均 121 FPS)約降低 -21% 的效能。
↑ 光追遊戲 1440p,開起光追、超解析度與畫格生成測試。
↑ 光追遊戲 2160p,開起光追、超解析度與畫格生成測試。
NVIDIA GeForce RTX 5070 – DLSS 4 多畫格生成效能實測
這段測試主要以 2160p 解析度、特效最高、全開光追的設定,並分別比較原生效能與 DLSS 4 加速後的效能表現,使用《漫威爭鋒》、《霍格華茲的傳承》、《Alan Wake 2》(全光追)與《電馭叛客 2077》(全光追)進行測試。
RTX 5070 在《漫威爭鋒》原生 45 FPS、DLSS 4 加速 237 FPS 約 5.2x 倍提升;《霍格華茲的傳承》原生 33 FPS、DLSS 4 加速 155 FPS 約 4.7x 倍提升。
其中提升最多的莫過於使用全光追的遊戲,《Alan Wake 2》原生 9 FPS、DLSS 4 加速至 97 FPS 約 10.7x 倍提升;《電馭叛客 2077》原生 10.6 FPS、DLSS 4 加速 120.4 FPS 約 11.3x 倍效能提升。
NVIDIA GeForce RTX 5070 功耗與溫度測量
顯卡的功耗與溫度測試,使用 Speed Way Stress test、Furmark2 與《電馭叛客 2077》進行測試。功耗測量時使用 NVIDIA 提供的 PACT 工具,可監控 PCIe 插槽與電源 12V 提供的瓦數。
顯卡溫度方面,RTX 5070 在壓力測試最高溫維持在 75.5°C,而 GDDR7 記憶體溫度最高則在 82°C,至於 2077 遊戲時溫度則會稍微降低 70.2°C。
功耗方面,RTX 50 與 RTX 40 世代都採用相同的製程,RTX 5070 功耗最高來到 259W。
總結
四平八穩、小降價!GeForce RTX 5070 可滿足 4K 60 FPS 的入門效能需求,即便對上次世代全光追遊戲也可靠著 DLSS 4 畫格生成提供穩定、低延遲的高效能。RTX 5070 在 2160p 解析度於 8 款 AAA 遊戲平均 88 FPS、7 款光追 DLSS 3 加速遊戲平均 96 FPS,更在 DLSS 4 多畫格生成加速下達到平均 152 FPS 的超高性能。
RTX 5070 相比上一代 RTX 4070 有著 22% 的遊戲效能提升,相比 RTX 5070 Ti 穩定降低 -22% 的遊戲效能;至於 RTX 5070 對上 RTX 4090,則是有著將近 -40% 的效能差距,但這差距只要靠著 DLSS 4 的 AI 4x 畫格生成大魔法,即可讓 RTX 5070 反超 RTX 4090 約 8% 的效能領先。
沒有 RTX 5070 Ti 給人的激情,RTX 5070 就像是教科書中的公式一樣,比上一代同級高 20% 的效能、比同一代上一階輸 -20% 的效能。但值得慶幸的是 RTX 5070 美金定價比上一代便宜 $50 美元,而這也是新一代 GPU 中台幣建議售價低於 2 萬元的型號。
若是預算有限但想要上至 4K 解析度的玩家,那 RTX 5070 搭配 DLSS 4 畫格生成,做為 4K 入門卡肯定非常有吸引力;但若是徘徊在主流 2K 與 4K 入門之間的玩家,或許會覺得 RTX 5070 的價位還是稍高一些(尤其首波量少的狀況下)。
總之 RTX 5070 將在明日 3/5 號正式推出,但同時也會有 RX 9070 系列推出,預算有限的玩家不妨在等等,或許 RTX 5060 系列也在不遠處了。