2K 我檔!NVIDIA GeForce RTX 4070 測試報告 / 每元性能更佳, DLSS3 補幀加速
同 RTX 3070 Ti 的 $599 美金定價,NVIDIA 新一代 GeForce RTX 4070 顯示卡,只需 200W 的功耗即可擁有 18% 一般遊戲效能升級與 42% 光追遊戲效能提升,更可達到 2K 解析度光追平均 115 FPS 的遊戲效能,藉由新一代 Ada Lovelace 架構帶來更強悍的每瓦遊戲性能,以及 DLSS 3 的 AI 補幀大加速時代。
內容目錄
RTX 40 系列玩家 83% 開啟光追、79% 開啟 DLSS、28% 是 4K 玩家
隨著第一代 NVIDIA RTX 技術於 2018 年推出,打開即時光線追蹤遊戲的一扇窗,並藉助 DLSS 的 AI 加速開啟另一扇門,而如今第三代 RTX 堆疊著許多 NVIDIA 技術,讓遊戲開發者、遊戲引擎、模擬、渲染等應用可有著更逼真、更有效率的光追渲染技術。
NVIDIA 也大方的分享一些有趣的數據,在 RTX 20 第一代推出時只有 37% 玩家開啟 RT 光追、26% 玩家開啟 DLSS 加速,也意味著當時技術還不算非常成熟,玩家接受度沒很高。而到現在最新的 RTX 40 顯卡玩家則提升至 83% 開啟 RT 光追、79% 玩家都會開啟 DLSS 加速。
另一方面 RTX 40 的玩家有著 62% 都是使用 144Hz 以上更新率的電競螢幕,不過讓人意外的是 4K 玩家僅只有 28%。也就是說目前主流的電競螢幕規格,還是以 1440p、1080p 為主的解析度,而更新率基本都在 144Hz 以上。
而從 2018 剛推出支援光追的《Battlefield V》遊戲,當時每個像素點只需運算 39 道光線追蹤,但是現在《Cyberpunk 2077》在全光追現追蹤下每個像素需要計算 635 道光線追蹤,僅 3 年的時間光追運算需求量達到 16x 倍的成長。
↑ RTX 40 玩家 83% 開啟 RT 光追、79% 開啟 DLSS 加速。
NVIDIA GeForce RTX 4070 登場 2K@100fps+ 光追、DLSS 3 加速
NVIDIA 新推出的 GeForce RTX 4070 顯示卡,採用 Ada Lovelace 架構,升級 SM、Tensor Core 與 RT Core 等核心,以及 DLSS 3 的 AI 補幀技術與 AV1 編碼引擎,鎖定 2K、1440p 遊戲玩家,美金定價 $599 元起。
RTX 4070 同價位相比上一代 RTX 3070 Ti,而從規格來看這代給予 12GB GDDR6X 記憶體,比起上一代還要大方之外,那就是 TGP 僅 200W、遊戲平均功耗 186W,並有著 AV1 編碼功能。
↑ NVIDIA GeForce RTX 4070 規格比較。
效能方面,RTX 4070 一般遊戲效能相比 RTX 3070 Ti 有著 20% 的提升,若加上 DLSS 3 加速後則有著 70% 的效能升級。而 RTX 4070 一般遊戲效能則與 RTX 3080 相當。若跟 RTX 2080 相比,一般遊戲有著 60% 提升、DLSS 3 加速則可到 120% 升級。
另一方面,NVIDIA 也宣布 RTX Remix Runtime Open Source,讓廣大的 Mod 玩家能改寫舊遊戲加入光線追蹤與更擬真的材質,透過 RTX re-render 讓 Portal 也可煥然一新。而 Runtime 將在 4/12 發表在 NVIDIA Github,後續還會再提供 Creator Toolkit。
↑ RTX Remix Runtime Open Source。
NVIDIA GeForce RTX 4070 創始版開箱 / 標準 24cm、2-slot 機殼友善卡
NVIDIA GeForce RTX 4070 創始版,終於回歸標準 24cm 長、2-slot 安裝空間的機殼友善顯示卡,維持著鋁合金打造的 X-Frame 框架、框架內則是填滿散熱鰭片,內部則是均溫板替 GPU、VRAM 散熱,再藉由熱導管將廢熱引導至散熱鰭片。
同樣配置 2 顆 9cm 風扇進行散熱,後方風扇直吹鰭片後從顯卡後方排出熱風,前方風扇則是帶進機殼前方氣流,通過鰭片、風扇後吹至顯卡上方,讓機殼內部有著更好的散熱氣流。
RTX 4070 創始版外觀造型依舊相當好看,漂亮高質感的鋁合金 X-Frame 框架,以及背面上的 RTX 4070 字樣與前方的抽風風扇配置。另一面則是滿滿的散熱鰭片,以及後方風扇的進氣散熱。
顯卡側面的中間一樣有著 PCIe 12+4 Pin(12VHPWR)的供電插座,不過據悉若是顯卡品牌的自製卡,也有使用傳統 PCIe 6+2 Pin 的供電設計。
↑ 創始版依舊使用 PCIe 12+4 Pin(12VHPWR)供電。
顯示輸出一樣提供 HDMI 2.1a 支援 VRR、4K120Hz / 8K60Hz HDR,以及 3 個 DisplayPort 1.4a DSC 支援 12-bit 4K240Hz HDR / 12-bit 8K60Hz HDR 等輸出能力,最多同時連接 4 個螢幕輸出。
配件中一樣有著 PCIe 12+4 Pin(12VHPWR)轉接 2 個 PCIe 6+2 Pin 的轉接線。
↑ PCIe 12+4 Pin(12VHPWR)轉接 2 個 PCIe 6+2 Pin 轉接線。
NVIDIA GeForce RTX 4070 創作、渲染效能測試
此次測試包含創作 DaVinci Resolve 18、Blender、Omniverse 等創作測試,遊戲則以 1440p、1080p 解析度、特效全開測試電競、AAA 遊戲與光追遊戲的效能,以及 DLSS 3 的相關測試,同時比較 RTX 4070 Ti 與 RTX 3070 Ti,讓玩家有更多的數據參考。
測試平台
處理器:Intel Core i9-13900K
主機板:ASUS ROG MAXIMUS Z790 HERO
記憶體:KLEVV DDR5-7200 16GBx2
顯示卡:GIGABYTE GeForce RTX 4070 Ti EAGLE、NVIDIA GeForce RTX 4070、3070 Ti 創始版
系統碟:Solidigm P41 Plus 1TB PCIe 4.0 SSD
散熱器:NZXT 360mm 水冷
電源供應器:Seasonic VERTEX GX-1000
作業系統:Windows 11 Pro 21H2 64bit、Resizable BAR On
驅動版本:NVIDIA 531.42
GPU-Z 還未能檢視 NVIDIA GeForce RTX 4070 資訊,採用 4nm 製程的 AD104 GPU,有著 5888 個渲染 CUDA 核心,以及 12288 MB GDDR6X(Micron)記憶體,而 GPU 預設時脈 1920 MHz、Boost 2475 MHz。
DaVinci Resolve 18 純粹通過 GPU 加速的影片剪輯程式,更包含強大的色彩校正與特效功能,並且直接使用 CUDA 核心運算,讓影片剪輯的回放與輸出都有著相當好的性能。
首先第一段測試的專案使用 4K Blackmagic RAW 影像,有著 Wedding_Heavy_Styles 時間軸,這段影片使用非常多的 Resolve 效果,像是 OFX: Light Rays / Glow / Sketch 等,輸出相當高風格的影片類型。
Bride_FaceRefine_Selective_Color 則使用 Face Refinement 做人臉的追蹤,並將主體新娘使用顏色凸顯;50% Retime 與 Optical Flow Enhanced Better 都使用 Optical Flow 技術降低影像 50% 速度。
SuperScale2x 4K Source 使用 4K ProRES 來源影片製作 2x Zoom In 主體的 4K 影片輸出;SuperScale4x HD_Source 則是使用 HD H.264 來源影片,利用 Resolve Super Scale 輸出成 4K 影片。
輸出時間相比 RTX 4070 並不會落後 RTX 4070 Ti 太多,反而對於影音用戶則是要考量顯卡記憶體容量,以及平時專案的容量來挑選顯卡。
第二段測試為雙 NVENC 編碼的 AV1 與 HEVC 編碼測試,測試專案是一段 44 秒的小短片,來至於 Blender Open Movie Project《Tears of Steel》,並有著 8k Prores442HQ 30FPS 與 4K Prores422HQ 30FPS 的影片,可用來測試輸出為 HEVC、AV1 編碼的效能。
輸出設定主要是使用 NVIDIA Encoder、Quality: Restrict to 80000 Kb/s、Encoding Profile: Main、Rate Control: Constant Bitrate、Preset: Faster、Tuning: High Quality、Two Pass: Disable 等輸出設定。
效能上在 4K、8K 輸出時 RTX 4070 相比 RTX 4070 Ti 並不會慢太多,但相比上一代 RTX 3070 Ti 就快了許多。
V-Ray Benchmark 是由 Chaos Group 所開發,V-Ray 是基於物理法則所設計的光線渲染軟體,而此工具可分別針對 CPU 與 GPU 進行光線追蹤的渲染圖像的運算測試。
V-Ray 測試,RTX 4070 比起 RTX 3070 Ti 有著 23% 的性能提升,相較於 RTX 4070 Ti 則是降低 -20% 的運算效能。
Blender 是跨平台、開放源碼的 3D 創作工具,支援著各種 3D 作業:Modeling、Rigging、Animation、Simulation、Rendering、Compositing 與 Motion Tracking 等。而測試,則以 Blender Benchmark 3.3.0 進行 Demo 專案的渲染工作測試。
Blender Benchmark 3.4.0 測試,RTX 4070 相比 RTX 3070 Ti 運算性能提升 42%,相比 RTX 4070 Ti 則是降低了 -18% 的運算效能。
NVIDIA GeForce RTX 4070 Omniverse Creator 測試
NVIDIA Omniverse 加速 3D 設計的協作平台,不僅能無縫支援業界主流的 3D apps,讓來自世界各地的創作者能同時創作 3D 專案,並得到即時的渲染效果呈現,更具備 Digital Twin、機器人訓練模擬等功能。
此次測試主要以 Omniverse Create 的專案來進行即時光追渲染、DLSS 3 加速的 FPS 效能測試。測試的專案則包含:Campfire_Main_03_Flow3 模擬營火燃燒的物理效果、Flowers4 測試 Instanced geometry and particle flow animation、Incense_Main 測試煙霧模擬與反射材料變化、JadeTiger 測試場景包含玉的高級材料的細緻模型、Warehouse_Physics_Stage 測試場景則是模擬倉庫貨架倒塌的骨牌效應。
RTX 4070 在 QHD ViewPort 與 DLSS3 Quality 設定下,可勉強達到平均 50 FPS 左右的渲染效能,相比 RTX 3070 Ti 可有著平均 139% 的效能領先,但相較於 RTX 4070 Ti 則是壓在平均 -20% 的效能差距。
NVIDIA GeForce RTX 4070 AI 算圖 Stable Diffusion 測試
現在很紅的 AI 深度學習文字到圖像的生成模型 Stable Diffusion,經過手動安裝機於 Automatic1111 Web UI 發行的版本,加入最新 cuDNN DLLs 讓 Stable Diffusion 能夠獲得最佳的 GPU 加速效能,藉此來比較 GPU 的 AI 運算能力。
測試的設定與咒語可參考圖片下方說明,通過測試 RTX 4070 可達到每分鐘 9.16 張的圖片生成速度,相比 RTX 3070 Ti 可有著 28% 的效能提升,對比 RTX 4070 Ti 則是稍低 -18% 的效能差距。
NVIDIA GeForce RTX 4070 – 3DMark 跑分效能測試
3DMark Fire Strike 效能測試,為主流的 DirectX 11 API 的測試情境,分別測試 1080p、Extreme 1440p 與 Ultra 2160p 的效能。
RTX 4070 在 Fire Strike 達到 36606 分、Extreme 21471 分、Ultra 10616 分的成績,相比 RTX 3070 Ti 繪圖效能平均 17% 提升,性能稍低於 RTX 4070 Ti 約 -20%。
3DMark Time Spy 則是採用 DirectX 12 API 所設計的測試情境,同樣是鎖定在 AAA 遊戲等級,分別測試 1440p 與 Extreme 2160p 的效能。
RTX 4070 在 Time Spy 達到 18588 分、Extreme 9203 分的總成績,比起 RTX 3070 Ti 有著 20%的性能提升,同樣小輸給 RTX 4070 Ti 約 -21%。
針對光線追蹤測試,3DMark Port Royal 在 AAA 遊戲中的場景中加入光線追蹤功能,考驗著新一代 GPU 對於硬體光線追蹤加速的能力。同時 DXR 測試,則是使用 DirectX Raytracing API 進行的功能測試;Speed Way 則是使用全光線追蹤所開發的測試情境。
RTX 4070 在未開 DLSS 的狀況下,Port Royal 達到 52.47 FPS、DXR 52 FPS、Speed Way 45.39 FPS 的成績,比起 RTX 3070 Ti 有著 35% 光追性能提升,但同樣小輸給 RTX 4070 Ti 約 -21% 的光追效能。
3DMark DLSS Feature Test 可針對 DLSS 3、DLSS 2 進行效能測試,設定為 3840 x 2160、Performance 加速設定。
RTX 4070 在 DLSS 2 可獲得 65.05 FPS 約 2.7x 倍的效能提升,而 DLSS 3 使用 AI 補幀的技術可達到 108.6 FPS 約 4.6x 倍的效能提升。
↑ 3DMark DLSS Feature Test,越高越好。
NVIDIA GeForce RTX 4070 – 4 款電競遊戲效能測試
4 款電競遊戲《虹彩六號:圍攻行動》、《英雄聯盟》、《APEX 英雄》與《CS:GO》等,都是重技巧、團隊的戰術競技射擊、DOTA 類型的遊戲,因此遊戲畫質、細節不高的狀況下,遊戲 FPS 也都是平均百幀以上的表現。測試以 2160p、1440p、特效最高設定進行。
對於電競遊戲來說 RTX 4070 效能依舊綽綽有餘相當強悍,可滿足電競玩家 1440p、200 FPS 以上的效能需求。RTX 4070 在 2K 解析度相比 RTX 3070 Ti 有著平均 9% 領先、小輸 RTX 4070 Ti 約 -12%。
NVIDIA GeForce RTX 4070 – 11 款遊戲效能測試
11 款 AAA 遊戲平均效能,同樣測試 1440p、1080p 特效全開進行測試,這段測試僅 F1 2021 使用光追功能,其餘遊戲無光追下、無 DLSS 加速,測試 GPU 的實際傳統渲染遊戲效能。
遊戲測試名單有入門的《F1 2021》、《Forspoken》、《古墓奇兵:暗影》、電影遊戲《死亡擱淺》、《戰爭機器 5》、《全境封鎖 2》、《地平線:期待黎明》,以及吃重效能的《邊緣禁地 3》、《刺客教條:維京紀元》、《碧血狂殺 2》與《戰神》等測試。
RTX 4070 在 1440p、AAA 遊戲達到平均 118.2 FPS,比起 RTX 3070 Ti 平均 100 FPS,可達到約 18% 效能升級,相較於 RTX 4070 Ti 則是小輸 -17% 的遊戲效能。
接著 1080p 解析度下 RTX 4070 平均 158.35 FPS,比起 RTX 3070 Ti 有著 20% 的效能升級,一樣小輸給 RTX 4070 Ti 約 -14%。
NVIDIA GeForce RTX 4070 – 10 款光追遊戲測試
10 款光追 DXR 遊戲測試,則加入年度最佳遊戲《巫師 3:狂獵》次世代改版加入光追 DLSS 的支援,以及 NVIDIA 模改的《Portal with RTX》光追版本,還有著《電馭叛客 2077》、《控制》、《看門狗:自由軍團》、《戰慄深邃:流亡》、《蜘蛛人:麥爾斯·摩拉斯》、《漫威星際異攻隊》與《極地戰嚎 6》等遊戲進行測試。
而《微軟模擬飛行》雖不支援光追,但啟用 DLSS 3 加速,因此也整理在這圖表當中。測試使用 1440p、1080p 解析度,特效 / 光追最高設定外,也會啟用 DLSS 加速,詳細設定請參考圖表說明。
RTX 4070 在 1440p 解析度、DLSS 3 加速下,讓《巫師 3:狂獵》達到平均 106 FPS、《Portal with RTX》平均 88 FPS、《電馭叛客 2077》平均 98 FPS 的出色效能;10 款光追遊戲平均可達 115.2 FPS。
RTX 4070 比起 RTX 3070 Ti 有著 42% 光追遊戲效能升級,相比 RTX 4070 Ti 約降低 -17% 的光追遊戲效能。
至於 1080p 解析度,RTX 4070 平均 144.5 FPS,比起 RTX 3070 Ti 有著 41% 的遊戲效能升級,相比 RTX 4070 Ti 約降低 -13% 的效能。
NVIDIA GeForce RTX 4070 功耗與溫度測量
顯卡的功耗與溫度測試,使用 Time Spy Stress test、Furmark 與《電馭叛客 2077》進行測試。功耗測量時使用 NVIDIA 提供的 PACT 工具,可監控 PCIe 插槽與電源 12V 提供的瓦數。
顯卡溫度方面,RTX 4070 創始版在壓力測試最高溫維持在 64.1°C,至於 2077 遊戲時溫度則會稍微降低 61°C,相比上一代 RTX 3070 Ti 的 76°C,這代創始版體積縮小加上 TSMC 製程與 NVIDIA 的努力,讓溫度表現可說是相當出色。
顯卡 TBP 功耗測試,在 Time Spy Stress test 時 RTX 4070 創始版平均達到 197.3W 的功耗,而 Furmark 4K Xtreme burn-in 測試下來到最高 200W,不過遊戲時 2077 僅 196.2W 的功耗,相比 RTX 3070 Ti 的 258W 功耗,只能說 TSMC 加上 NVIDIA 真的無人可檔。
總結
NVIDIA GeForce RTX 4070 滿足 2K 遊戲玩家的效能需求,11 款 AAA 遊戲平均 118.2 FPS、10 款光追遊戲平均 115.2 FPS 的遊戲效能,比起上一代同價位的 RTX 3070 Ti,能夠帶來一般遊戲 18% 的效能提升,以及光追 DLSS 3 遊戲 41% 的效能升級。
而 NVIDIA 也剛剛好的讓 RTX 4070 在創作、遊戲等效能上小輸 RTX 4070 Ti 約 -20% 的效能。不過保有 12GB GDDR6X 記憶體、美金定價 599 元、台幣建議售價為 20,990 元的價格,讓顯卡預算在 2 萬左右的玩家,能有更出色的 2K 遊戲與創作效能升級。
目前 NVIDIA 顯卡市場也已經快清空原本 RTX 3070 Ti 的顯卡,為了就是迎接 4/13 晚上 9 點開賣的 RTX 4070 新卡,而台灣定價是 20,990 元這匯率還算合理。而根據手邊數據來計算每元遊戲效能來看,RTX 4070 性價高於 RTX 4070 Ti 與上一代的 RTX 3070 Ti,倘若預算在 2 萬左右,選擇新一代的 RTX 4070 解鎖 DLSS 3 加速,肯定是更划算的選擇。