顯示卡、器

2K 我檔!NVIDIA GeForce RTX 4070 測試報告 / 每元性能更佳, DLSS3 補幀加速

同 RTX 3070 Ti 的 $599 美金定價,NVIDIA 新一代 GeForce RTX 4070 顯示卡,只需 200W 的功耗即可擁有 18% 一般遊戲效能升級與 42% 光追遊戲效能提升,更可達到 2K 解析度光追平均 115 FPS 的遊戲效能,藉由新一代 Ada Lovelace 架構帶來更強悍的每瓦遊戲性能,以及 DLSS 3 的 AI 補幀大加速時代。

RTX 40 系列玩家 83% 開啟光追、79% 開啟 DLSS、28% 是 4K 玩家

隨著第一代 NVIDIA RTX 技術於 2018 年推出,打開即時光線追蹤遊戲的一扇窗,並藉助 DLSS 的 AI 加速開啟另一扇門,而如今第三代 RTX 堆疊著許多 NVIDIA 技術,讓遊戲開發者、遊戲引擎、模擬、渲染等應用可有著更逼真、更有效率的光追渲染技術。


↑ 第三代 RTX 所堆疊的技術。

 

NVIDIA 也大方的分享一些有趣的數據,在 RTX 20 第一代推出時只有 37% 玩家開啟 RT 光追、26% 玩家開啟 DLSS 加速,也意味著當時技術還不算非常成熟,玩家接受度沒很高。而到現在最新的 RTX 40 顯卡玩家則提升至 83% 開啟 RT 光追、79% 玩家都會開啟 DLSS 加速。

另一方面 RTX 40 的玩家有著 62% 都是使用 144Hz 以上更新率的電競螢幕,不過讓人意外的是 4K 玩家僅只有 28%。也就是說目前主流的電競螢幕規格,還是以 1440p、1080p 為主的解析度,而更新率基本都在 144Hz 以上。

而從 2018 剛推出支援光追的《Battlefield V》遊戲,當時每個像素點只需運算 39 道光線追蹤,但是現在《Cyberpunk 2077》在全光追現追蹤下每個像素需要計算 635 道光線追蹤,僅 3 年的時間光追運算需求量達到 16x 倍的成長。


↑ RTX 40 玩家 83% 開啟 RT 光追、79% 開啟 DLSS 加速。


↑ 16x 倍光追運算需求量提升。


↑ RTX 40 玩家 62% 144Hz、4K 28%。

 

NVIDIA GeForce RTX 4070 登場 2K@100fps+ 光追、DLSS 3 加速

NVIDIA 新推出的 GeForce RTX 4070 顯示卡,採用 Ada Lovelace 架構,升級 SM、Tensor Core 與 RT Core 等核心,以及 DLSS 3 的 AI 補幀技術與 AV1 編碼引擎,鎖定 2K、1440p 遊戲玩家,美金定價 $599 元起。

RTX 4070 同價位相比上一代 RTX 3070 Ti,而從規格來看這代給予 12GB GDDR6X 記憶體,比起上一代還要大方之外,那就是 TGP 僅 200W、遊戲平均功耗 186W,並有著 AV1 編碼功能。


↑ NVIDIA GeForce RTX 4070 規格比較。


↑ RTX 40 系列規格表。

 

效能方面,RTX 4070 一般遊戲效能相比 RTX 3070 Ti 有著 20% 的提升,若加上 DLSS 3 加速後則有著 70% 的效能升級。而 RTX 4070 一般遊戲效能則與 RTX 3080 相當。若跟 RTX 2080 相比,一般遊戲有著 60% 提升、DLSS 3 加速則可到 120% 升級。


↑ 同樣 $599 元但有著 DLSS 3 加速。


↑ 相比 RTX 2080 效能升級則更亮眼。

 

另一方面,NVIDIA 也宣布 RTX Remix Runtime Open Source,讓廣大的 Mod 玩家能改寫舊遊戲加入光線追蹤與更擬真的材質,透過 RTX re-render 讓 Portal 也可煥然一新。而 Runtime 將在 4/12 發表在 NVIDIA Github,後續還會再提供 Creator Toolkit。


↑ RTX Remix Runtime Open Source。


↑ NVIDIA 新家族清單。

 

NVIDIA GeForce RTX 4070 創始版開箱 / 標準 24cm、2-slot 機殼友善卡

NVIDIA GeForce RTX 4070 創始版,終於回歸標準 24cm 長、2-slot 安裝空間的機殼友善顯示卡,維持著鋁合金打造的 X-Frame 框架、框架內則是填滿散熱鰭片,內部則是均溫板替 GPU、VRAM 散熱,再藉由熱導管將廢熱引導至散熱鰭片。

同樣配置 2 顆 9cm 風扇進行散熱,後方風扇直吹鰭片後從顯卡後方排出熱風,前方風扇則是帶進機殼前方氣流,通過鰭片、風扇後吹至顯卡上方,讓機殼內部有著更好的散熱氣流。


↑ 創始版獨特的外包裝。


↑ 自帶驚喜的包裝。

 

RTX 4070 創始版外觀造型依舊相當好看,漂亮高質感的鋁合金 X-Frame 框架,以及背面上的 RTX 4070 字樣與前方的抽風風扇配置。另一面則是滿滿的散熱鰭片,以及後方風扇的進氣散熱。


↑ RTX 4070 創始版背面。


↑ RTX 4070 創始版正面。

 

顯卡側面的中間一樣有著 PCIe 12+4 Pin(12VHPWR)的供電插座,不過據悉若是顯卡品牌的自製卡,也有使用傳統 PCIe 6+2 Pin 的供電設計。


↑ 創始版依舊使用 PCIe 12+4 Pin(12VHPWR)供電。


↑ 顯卡前方的支撐架鎖孔。

 

顯示輸出一樣提供 HDMI 2.1a 支援 VRR、4K120Hz / 8K60Hz HDR,以及 3 個 DisplayPort 1.4a DSC 支援 12-bit 4K240Hz HDR / 12-bit 8K60Hz HDR 等輸出能力,最多同時連接 4 個螢幕輸出。


↑ 顯示輸出。

 

配件中一樣有著 PCIe 12+4 Pin(12VHPWR)轉接 2 個 PCIe 6+2 Pin 的轉接線。


↑ PCIe 12+4 Pin(12VHPWR)轉接 2 個 PCIe 6+2 Pin 轉接線。


↑ 沖天炮。


↑ 接頭一定要插牢。

 

NVIDIA GeForce RTX 4070 創作、渲染效能測試

此次測試包含創作 DaVinci Resolve 18、Blender、Omniverse 等創作測試,遊戲則以 1440p、1080p 解析度、特效全開測試電競、AAA 遊戲與光追遊戲的效能,以及 DLSS 3 的相關測試,同時比較 RTX 4070 Ti 與 RTX 3070 Ti,讓玩家有更多的數據參考。

測試平台
處理器:Intel Core i9-13900K
主機板:ASUS ROG MAXIMUS Z790 HERO
記憶體:KLEVV DDR5-7200 16GBx2
顯示卡:GIGABYTE GeForce RTX 4070 Ti EAGLE、NVIDIA GeForce RTX 4070、3070 Ti 創始版
系統碟:Solidigm P41 Plus 1TB PCIe 4.0 SSD
散熱器:NZXT 360mm 水冷
電源供應器:Seasonic VERTEX GX-1000
作業系統:Windows 11 Pro 21H2 64bit、Resizable BAR On
驅動版本:NVIDIA 531.42

 

GPU-Z 還未能檢視 NVIDIA GeForce RTX 4070 資訊,採用 4nm 製程的 AD104 GPU,有著 5888 個渲染 CUDA 核心,以及 12288 MB GDDR6X(Micron)記憶體,而 GPU 預設時脈 1920 MHz、Boost 2475 MHz。


↑ GPU-Z。

 

DaVinci Resolve 18 純粹通過 GPU 加速的影片剪輯程式,更包含強大的色彩校正與特效功能,並且直接使用 CUDA 核心運算,讓影片剪輯的回放與輸出都有著相當好的性能。


↑ DaVinci Resolve 18。

 

首先第一段測試的專案使用 4K Blackmagic RAW 影像,有著 Wedding_Heavy_Styles 時間軸,這段影片使用非常多的 Resolve 效果,像是 OFX: Light Rays / Glow / Sketch 等,輸出相當高風格的影片類型。

Bride_FaceRefine_Selective_Color 則使用 Face Refinement 做人臉的追蹤,並將主體新娘使用顏色凸顯;50% Retime 與 Optical Flow Enhanced Better 都使用 Optical Flow 技術降低影像 50% 速度。

SuperScale2x 4K Source 使用 4K ProRES 來源影片製作 2x Zoom In 主體的 4K 影片輸出;SuperScale4x HD_Source 則是使用 HD H.264 來源影片,利用 Resolve Super Scale 輸出成 4K 影片。

輸出時間相比 RTX 4070 並不會落後 RTX 4070 Ti 太多,反而對於影音用戶則是要考量顯卡記憶體容量,以及平時專案的容量來挑選顯卡。


↑ DaVinci Resolve 18,時間越短越好。

 

第二段測試為雙 NVENC 編碼的 AV1 與 HEVC 編碼測試,測試專案是一段 44 秒的小短片,來至於 Blender Open Movie Project《Tears of Steel》,並有著 8k Prores442HQ 30FPS 與 4K Prores422HQ 30FPS 的影片,可用來測試輸出為 HEVC、AV1 編碼的效能。

輸出設定主要是使用 NVIDIA Encoder、Quality: Restrict to 80000 Kb/s、Encoding Profile: Main、Rate Control: Constant Bitrate、Preset: Faster、Tuning: High Quality、Two Pass: Disable 等輸出設定。

效能上在 4K、8K 輸出時 RTX 4070 相比 RTX 4070 Ti 並不會慢太多,但相比上一代 RTX 3070 Ti 就快了許多。


↑ DaVinci Resolve 18,時間越短越好。

 

V-Ray Benchmark 是由 Chaos Group 所開發,V-Ray 是基於物理法則所設計的光線渲染軟體,而此工具可分別針對 CPU 與 GPU 進行光線追蹤的渲染圖像的運算測試。

V-Ray 測試,RTX 4070 比起 RTX 3070 Ti 有著 23% 的性能提升,相較於 RTX 4070 Ti 則是降低 -20% 的運算效能。


↑ V-Ray Benchmark,效能越高越好。

 

Blender 是跨平台、開放源碼的 3D 創作工具,支援著各種 3D 作業:Modeling、Rigging、Animation、Simulation、Rendering、Compositing 與 Motion Tracking 等。而測試,則以 Blender Benchmark 3.3.0 進行 Demo 專案的渲染工作測試。

Blender Benchmark 3.4.0 測試,RTX 4070 相比 RTX 3070 Ti 運算性能提升 42%,相比 RTX 4070 Ti 則是降低了 -18% 的運算效能。


↑ Blender,效能越高越好。

 

NVIDIA GeForce RTX 4070 Omniverse Creator 測試

NVIDIA Omniverse 加速 3D 設計的協作平台,不僅能無縫支援業界主流的 3D apps,讓來自世界各地的創作者能同時創作 3D 專案,並得到即時的渲染效果呈現,更具備 Digital Twin、機器人訓練模擬等功能。

此次測試主要以 Omniverse Create 的專案來進行即時光追渲染、DLSS 3 加速的 FPS 效能測試。測試的專案則包含:Campfire_Main_03_Flow3 模擬營火燃燒的物理效果、Flowers4 測試 Instanced geometry and particle flow animation、Incense_Main 測試煙霧模擬與反射材料變化、JadeTiger 測試場景包含玉的高級材料的細緻模型、Warehouse_Physics_Stage 測試場景則是模擬倉庫貨架倒塌的骨牌效應。


↑ Omniverse Create。

 

RTX 4070 在 QHD ViewPort 與 DLSS3 Quality 設定下,可勉強達到平均 50 FPS 左右的渲染效能,相比 RTX 3070 Ti 可有著平均 139% 的效能領先,但相較於 RTX 4070 Ti 則是壓在平均 -20% 的效能差距。


↑ Omniverse Create,分數越高越好。

 

NVIDIA GeForce RTX 4070 AI 算圖 Stable Diffusion 測試

現在很紅的 AI 深度學習文字到圖像的生成模型 Stable Diffusion,經過手動安裝機於 Automatic1111 Web UI 發行的版本,加入最新 cuDNN DLLs 讓 Stable Diffusion 能夠獲得最佳的 GPU 加速效能,藉此來比較 GPU 的 AI 運算能力。


↑ Stable Diffusion。

 

測試的設定與咒語可參考圖片下方說明,通過測試 RTX 4070 可達到每分鐘 9.16 張的圖片生成速度,相比 RTX 3070 Ti 可有著 28% 的效能提升,對比 RTX 4070 Ti 則是稍低 -18% 的效能差距。


↑ Stable Diffusion,越高越好。

 

NVIDIA GeForce RTX 4070 – 3DMark 跑分效能測試

3DMark Fire Strike 效能測試,為主流的 DirectX 11 API 的測試情境,分別測試 1080p、Extreme 1440p 與 Ultra 2160p 的效能。

RTX 4070 在 Fire Strike 達到 36606 分、Extreme 21471 分、Ultra 10616 分的成績,相比 RTX 3070 Ti 繪圖效能平均 17% 提升,性能稍低於 RTX 4070 Ti 約 -20%。


↑ 3DMark Fire Strike,分數越高越好。

 

3DMark Time Spy 則是採用 DirectX 12 API 所設計的測試情境,同樣是鎖定在 AAA 遊戲等級,分別測試 1440p 與 Extreme 2160p 的效能。

RTX 4070 在 Time Spy 達到 18588 分、Extreme 9203 分的總成績,比起 RTX 3070 Ti 有著 20%的性能提升,同樣小輸給 RTX 4070 Ti 約 -21%。


↑ 3DMark Time Spy,分數越高越好。

 

針對光線追蹤測試,3DMark Port Royal 在 AAA 遊戲中的場景中加入光線追蹤功能,考驗著新一代 GPU 對於硬體光線追蹤加速的能力。同時 DXR 測試,則是使用 DirectX Raytracing API 進行的功能測試;Speed Way 則是使用全光線追蹤所開發的測試情境。

RTX 4070 在未開 DLSS 的狀況下,Port Royal 達到 52.47 FPS、DXR 52 FPS、Speed Way 45.39 FPS 的成績,比起 RTX 3070 Ti 有著 35% 光追性能提升,但同樣小輸給 RTX 4070 Ti 約 -21% 的光追效能。


↑ 3DMark DXR,越高越好。

 

3DMark DLSS Feature Test 可針對 DLSS 3、DLSS 2 進行效能測試,設定為 3840 x 2160、Performance 加速設定。

RTX 4070 在 DLSS 2 可獲得 65.05 FPS 約 2.7x 倍的效能提升,而 DLSS 3 使用 AI 補幀的技術可達到 108.6 FPS 約 4.6x 倍的效能提升。


↑ 3DMark DLSS Feature Test,越高越好。

 

NVIDIA GeForce RTX 4070 – 4 款電競遊戲效能測試

4 款電競遊戲《虹彩六號:圍攻行動》、《英雄聯盟》、《APEX 英雄》與《CS:GO》等,都是重技巧、團隊的戰術競技射擊、DOTA 類型的遊戲,因此遊戲畫質、細節不高的狀況下,遊戲 FPS 也都是平均百幀以上的表現。測試以 2160p、1440p、特效最高設定進行。

對於電競遊戲來說 RTX 4070 效能依舊綽綽有餘相當強悍,可滿足電競玩家 1440p、200 FPS 以上的效能需求。RTX 4070 在 2K 解析度相比 RTX 3070 Ti 有著平均 9% 領先、小輸 RTX 4070 Ti 約 -12%。


↑ 1440p 電競遊戲測試,FPS 越高越好。


↑ 1080p 電競遊戲測試,FPS 越高越好。

 

NVIDIA GeForce RTX 4070 – 11 款遊戲效能測試

11 款 AAA 遊戲平均效能,同樣測試 1440p、1080p 特效全開進行測試,這段測試僅 F1 2021 使用光追功能,其餘遊戲無光追下、無 DLSS 加速,測試 GPU 的實際傳統渲染遊戲效能。

遊戲測試名單有入門的《F1 2021》、《Forspoken》、《古墓奇兵:暗影》、電影遊戲《死亡擱淺》、《戰爭機器 5》、《全境封鎖 2》、《地平線:期待黎明》,以及吃重效能的《邊緣禁地 3》、《刺客教條:維京紀元》、《碧血狂殺 2》與《戰神》等測試。

RTX 4070 在 1440p、AAA 遊戲達到平均 118.2 FPS,比起 RTX 3070 Ti 平均 100 FPS,可達到約 18% 效能升級,相較於 RTX 4070 Ti 則是小輸 -17% 的遊戲效能。

接著 1080p 解析度下 RTX 4070 平均 158.35 FPS,比起 RTX 3070 Ti 有著 20% 的效能升級,一樣小輸給 RTX 4070 Ti 約 -14%。


↑ 1440p AAA 遊戲測試,FPS 越高越好。


↑ 1080p AAA 遊戲測試,FPS 越高越好。

 

NVIDIA GeForce RTX 4070 – 10 款光追遊戲測試

10 款光追 DXR 遊戲測試,則加入年度最佳遊戲《巫師 3:狂獵》次世代改版加入光追 DLSS 的支援,以及 NVIDIA 模改的《Portal with RTX》光追版本,還有著《電馭叛客 2077》、《控制》、《看門狗:自由軍團》、《戰慄深邃:流亡》、《蜘蛛人:麥爾斯·摩拉斯》、《漫威星際異攻隊》與《極地戰嚎 6》等遊戲進行測試。

而《微軟模擬飛行》雖不支援光追,但啟用 DLSS 3 加速,因此也整理在這圖表當中。測試使用 1440p、1080p 解析度,特效 / 光追最高設定外,也會啟用 DLSS 加速,詳細設定請參考圖表說明。

RTX 4070 在 1440p 解析度、DLSS 3 加速下,讓《巫師 3:狂獵》達到平均 106 FPS、《Portal with RTX》平均 88 FPS、《電馭叛客 2077》平均 98 FPS 的出色效能;10 款光追遊戲平均可達 115.2 FPS。

RTX 4070 比起 RTX 3070 Ti 有著 42% 光追遊戲效能升級,相比 RTX 4070 Ti 約降低 -17% 的光追遊戲效能。

至於 1080p 解析度,RTX 4070 平均 144.5 FPS,比起 RTX 3070 Ti 有著 41% 的遊戲效能升級,相比 RTX 4070 Ti 約降低 -13% 的效能。


↑ 1440p 光追遊戲測試,FPS 越高越好。


↑ 1080p 光追遊戲測試,FPS 越高越好。

 

NVIDIA GeForce RTX 4070 功耗與溫度測量

顯卡的功耗與溫度測試,使用 Time Spy Stress test、Furmark 與《電馭叛客 2077》進行測試。功耗測量時使用 NVIDIA 提供的 PACT 工具,可監控 PCIe 插槽與電源 12V 提供的瓦數。

顯卡溫度方面,RTX 4070 創始版在壓力測試最高溫維持在 64.1°C,至於 2077 遊戲時溫度則會稍微降低 61°C,相比上一代 RTX 3070 Ti 的 76°C,這代創始版體積縮小加上 TSMC 製程與 NVIDIA 的努力,讓溫度表現可說是相當出色。


↑ RTX 4070 創始版溫度測試。

 

顯卡 TBP 功耗測試,在 Time Spy Stress test 時 RTX 4070 創始版平均達到 197.3W 的功耗,而 Furmark 4K Xtreme burn-in 測試下來到最高 200W,不過遊戲時 2077 僅 196.2W 的功耗,相比 RTX 3070 Ti 的 258W 功耗,只能說 TSMC 加上 NVIDIA 真的無人可檔。


↑ RTX 4070 創始版功耗測試。

 

總結

NVIDIA GeForce RTX 4070 滿足 2K 遊戲玩家的效能需求,11 款 AAA 遊戲平均 118.2 FPS、10 款光追遊戲平均 115.2 FPS 的遊戲效能,比起上一代同價位的 RTX 3070 Ti,能夠帶來一般遊戲 18% 的效能提升,以及光追 DLSS 3 遊戲 41% 的效能升級。

而 NVIDIA 也剛剛好的讓 RTX 4070 在創作、遊戲等效能上小輸 RTX 4070 Ti 約 -20% 的效能。不過保有 12GB GDDR6X 記憶體、美金定價 599 元、台幣建議售價為 20,990 元的價格,讓顯卡預算在 2 萬左右的玩家,能有更出色的 2K 遊戲與創作效能升級。

目前 NVIDIA 顯卡市場也已經快清空原本 RTX 3070 Ti 的顯卡,為了就是迎接 4/13 晚上 9 點開賣的 RTX 4070 新卡,而台灣定價是 20,990 元這匯率還算合理。而根據手邊數據來計算每元遊戲效能來看,RTX 4070 性價高於 RTX 4070 Ti 與上一代的 RTX 3070 Ti,倘若預算在 2 萬左右,選擇新一代的 RTX 4070 解鎖 DLSS 3 加速,肯定是更划算的選擇。

延伸影片閱讀:  
Previous post

RTX 40 系列玩家 83% 開啟光追、79% 開啟 DLSS、28% 是 4K 玩家

Next post

Dell 推出新一代商用筆電、工作站與桌上型系列機種以滿足新世代工作模式需求

The Author

sinchen

sinchen

我是 Sinchen。