4K60 我扛!GIGABYTE GeForce RTX 4070 Ti EAGLE 測試報告 / 效能大升 價格小升
NVIDIA 第三張 Ada Lovelace 架構遊戲顯示卡「GeForce RTX 4070 Ti」,憑著 SM、Tensor Core 與 RT Core 升級,以及 DLSS 3 的 AI 補幀技術與 AV1 雙編碼引擎,能有著更出色的遊戲效能,並成為新一代 4K60 守門卡,但是美金定價 $799、台幣 NT$ 28,990 元起的價格;此次使用技嘉 RTX 4070 Ti EAGLE 顯示卡進行測試。
內容目錄
新一代 4K60 守門卡!NVIDIA GeForce RTX 4070 Ti 登場
NVIDIA 新一代 4K60 守門卡「GeForce RTX 4070 Ti」,有別於旗艦 RTX 4090、RTX 4080 驚人的價格與 4K 100 FPS 的頂級效能,RTX 4070 Ti 以美金定價 $799 元滿足 4K 60 FPS 的遊戲效能,對比上代守門卡 RTX 3080,可有著 16% AAA 與 38% 的光追遊戲效能提升,但相對的定價也貴了 $100 美金。
NVIDIA GeForce RTX 4070 Ti 採用 AD104 GPU,有著 60 組 SM、7680 個 CUDA 核心、240 個 Tensor Core 與 60 個 RT Core,以及更高的 2.6GHz 的 Boost 時脈,搭配 12GB GDDR6X 的高速記憶體,更只需 285W TGP 功耗。
從定價、效能階級來看,RTX 4070 Ti 比較接近 RTX 3080,主要在光追遊戲有著不錯的升級,並可達到更出色的 4K 遊戲效能。而 RTX 4070 Ti 相較於 RTX 4080,則是切的剛剛好 -20% 的遊戲效能,因此每元效能相比之下 RTX 4070 Ti 的性價則高於 RTX 4080 不少。
Ada Lovelace:製程時脈升級、精進光線追蹤與雙 AV1 Encode
這代 Ada 架構除了改進 SM 單元外,亦有著 GDDR6X 高速記憶體、第 4 代 Tensor Cores 提升 AI 推論效能、第 3 代 RT Core 提升光線追蹤的質量,以及第 8 代影音編碼器支援 AV1 硬體編碼功能,還有著 DLSS 3 所帶來的 2-4x 的效能升級。
詳細的 Ada 架構升級可參考上一篇「NVIDIA GeForce RTX 4090 測試報告」(https://news.xfastest.com/?p=119051),本篇就以重點摘要說明。
首先 Ada 第 4 代 Tensor Core 能夠帶來 2x 倍的 FP16、BF16、TF32、INT8 與 INT4 的 Tensor TFLOPS 效能提升,同時加入 Hopper 架構的 FP8 Transformer Engine,能提供 1.3 PetaFLOPS 的 Tensor Core 效能。
而第 3 代 RT Core 能帶來 2x 倍快的 Ray-Triangle Intersection 輸出效能(相較於上代 Ampere),同時加入全新的 Opacity Micromap Engine、Displaced Micro-Mesh Engine 與 Shader Execution Reordering 等新技術,能夠再次提升光線追蹤的效能。
↑ Opacity Micromap Engine,讓物件能有透明、半透明、不透明的屬性,加速光追處理的效能。
↑ Displaced Micro-Mesh Engine,將物件採用較簡單的 BVH 表示,並依據向量地圖來快速算出物件的光追效果。
↑ Shader Execution Reordering,能夠優化 SM 處理光追的排程提升性能。
創作方面 Ada Lovelace 具備第 8 代雙 NVENC 編碼引擎,主要是加入 AV1 的影音編碼功能,而這代影音輸出能獲得 2x 倍的效能提升,需要影片編輯軟體支援像是 DaVinci Resolve、Voukoder、簡映都會在第一時間支援 RTX 40 的雙編碼引擎,至於主流的 Adobe Premiere Pro 則要等日後更新了。
大加速時代 DLSS 3 與 Optical Flow Accelerator
RTX 40 獨有的「DLSS 3」則是基於 DLSS 2 的技術下,加入「AI 補幀」的概念,也就是納入 Optical Flow Accelerator 的功能。Optical Flow 是電腦視覺所使用的光流法,用來計算連續的影像中,每個像素的移動方向與移動量。
DLSS 3 技術則需要遊戲引擎提供:較低解析度的渲染畫面與 Motion Vectors,通過 DLSS 的深度學習網路推論出高解析度的影像,並將影像提供給 Optical Flow Accelerator 計算每個像素的移動方向與移動量,最後通過 Optical Multi Frame Generation 產生出 AI 補幀的畫面。
DLSS 3 通過 AI 補幀能夠提供 2-4x 倍的遊戲效能提升,同時維持著與原生渲染相似的畫質,但是也會增加遊戲的整體延遲,因此 NVIDIA 強制 DLSS 3 包含 Reflex 技術,藉由取消 Render Queue 讓 CPU 處理完 GPU 立刻接手渲染,達到更低的系統延遲效果。
因此 DLSS 3 結合 AI Super Resolution、Frame Generation 與 ReFlex 等技術,靠著第 4 代 Tensor Core、Optical Flow Accelerator,以及 NVIDIA 用來訓練 AI 的超級電腦,滿足次世代遊戲玩家 4K、100 FPS 的極致效能。
GIGABYTE GeForce RTX 4070 Ti EAGLE 開箱 / 標準定價鷹卡 散熱性價強悍
這次 NVIDIA 並沒有生產 RTX 4070 Ti 的創始版,因此由顯卡品牌推出自製卡,技嘉首張標準定價的鷹卡「RTX 4070 Ti EAGLE」,有著 30cm 長、13.6cm 寬與 5.8cm 佔用 3-Slot 的安裝空間,並採用風之力散熱系統,以 3 顆正逆轉風扇搭配均溫板、熱導管與滿板散熱鰭片給予玩家最強悍的遊戲效能與散熱表現。
↑ GIGABYTE GeForce RTX 4070 Ti EAGLE 顯卡外盒。
↑ 背面則提到正逆轉風扇、均溫板熱導管、RGB 燈效等特色。
技嘉 GeForce RTX 4070 Ti EAGLE 顯示卡,採用髮絲、霧面的雙表面處理,搭配未來、宇宙的相關圖案紋路,以及 3 顆 90mm 正逆轉風扇,能夠減少風扇的擾流帶給散熱器最大的散熱氣流。
↑ 技嘉 GeForce RTX 4070 Ti EAGLE 顯示卡外觀。
顯卡的上方側面,除有著 GEFORCE RTX 字樣還有著 GIGABYTE 的 RGB Logo,此用這側面可見金屬背板除保護顯卡背面外,也在邊緣處上凹包住電路板,給予顯卡更好的強化設計。
此外,RTX 4070 Ti 需要使用 1 個 16-pin 12VHPWR 或 2 個 PCIe 8-pin 供電,而在插頭背面的電路板則有電源指示燈,倘若沒接顯卡電源就開機則會橫亮白燈,又如果電源線沒接好或不穩定則會閃爍,玩家在 DIY 組裝時也可更容易檢查顯卡電源的安裝是否正確。
↑ 12VHPWR 與電源指示燈;此外也提供雙 BIOS 切換功能。
顯卡背面的金屬背板,同時右側前方大開孔,可讓顯卡的散熱氣流通過讓機殼內部有更好的散熱氣流。
顯示輸出則提供基本的 3 個 DisplayPort 1.4 與 1 個 HDMI 2.1 連接埠。
顯卡拆解可見 RTX 4070 Ti EAGLE 一樣採用短電路板,留下前方大面積的散熱開孔;而 RTX 4070 Ti 使用 AD104 GPU,周圍則有 6 顆 GDDR6 記憶體組成 12GB 容量。並且技嘉使用 Ultra Durable 認證的電容、電感與 2oz 銅的電路板。
散熱器則是以均溫板直觸 GPU,並替周圍的記憶體、VRM 供電元件散熱,同時複合 6 根散熱導管,將廢熱引導至前後兩組散熱鰭片,提升整體的散熱壓制力。
配件中,技嘉則提供 16-pin 12VHPWR 轉 2 個 PCIe 8-pin 的轉接線,以及簡易型抗彎板的顯卡支撐架配件。
RTX 4070 Ti 僅需 TGP 285W 的功耗,因此建議玩家裝機時搭配 750W 以上的電源。
↑ 16-pin 12VHPWR 轉 2 個 PCIe 8-pin 轉接線。
技嘉簡易型抗彎板的顯卡支撐架配件,則是先將支架鎖在顯卡前方,並將另一個 L 形支架鎖在主機板與機殼的 ATX 鎖孔,藉此撐住顯卡重量。
顯卡燈效則是於正面的 RGB 燈條,以及側面的 GIGABYTE Logo。
玩家可通過 GIGABYTE CONTROL CENTER 軟體來控制顯卡的風扇、效能與 RGB 燈效。像是自訂風扇的曲線,預設顯卡具備 0dB 停轉的功能,玩家可透過調整曲線來自訂風扇轉速;而效能設定則包含 GPU 電壓、電源、溫度上限的解鎖,並提供 OC SCANNER 功能。
GIGABYTE GeForce RTX 4070 Ti EAGLE 創作影音輸出、GPU 渲染效能測試
此次測試包含創作 Adobe Premiere Pro 2020、DaVinci Resolve 18 與 Blender等創作測試,遊戲則以 2160p、1440p 解析度、特效全開測試電競、AAA 遊戲與光追遊戲的效能,以及 DLSS 3 的相關測試,同時比較 RTX 4080 與 RTX 3080,讓玩家有更多的數據參考。
測試平台
處理器:Intel Core i9-13900K
主機板:ASUS ROG MAXIMUS Z790 HERO 0502
記憶體:G.SKILL TRIDENT Z5 NEO DDR5-6000 16GBx2
顯示卡:NVIDIA GeForce RTX 4080 創始版、GIGABYTE GeForce RTX 4070 Ti EAGLE、NVIDIA GeForce RTX 3080 創始版
系統碟:Solidigm P41 Plus 1TB PCIe 4.0 SSD
散熱器:Phanteks Glacier One 360MPH
電源供應器:Seasonic VERTEX GX-1000
作業系統:Windows 11 Pro 21H2 64bit、Resizable BAR On
驅動版本:NVIDIA 527.62 / AMD 22.12.2
GPU-Z 還未能檢視 NVIDIA GeForce RTX 4070 Ti 資訊,其採用 4nm 製程的 AD104 GPU,有著 7680 個渲染 CUDA 核心,以及 12288 MB GDDR6X(Micron)記憶體,而 GPU 預設時脈 2310 MHz、Boost 2610 MHz。
DaVinci Resolve 18 純粹通過 GPU 加速的影片剪輯程式,更包含強大的色彩校正與特效功能,並且直接使用 CUDA 核心運算,讓影片剪輯的回放與輸出都有著相當好的性能。測試版本則包含支援 NVIDIA AV1 編碼功能。
首先第一段測試的專案使用 4K Blackmagic RAW 影像,有著 Wedding_Heavy_Styles 時間軸,這段影片使用非常多的 Resolve 效果,像是 OFX: Light Rays / Glow / Sketch 等,輸出相當高風格的影片類型。
Bride_FaceRefine_Selective_Color 則使用 Face Refinement 做人臉的追蹤,並將主體新娘使用顏色凸顯;50% Retime 與 Optical Flow Enhanced Better 都使用 Optical Flow 技術降低影像 50% 速度。
SuperScale2x 4K Source 使用 4K ProRES 來源影片製作 2x Zoom In 主體的 4K 影片輸出;SuperScale4x HD_Source 則是使用 HD H.264 來源影片,利用 Resolve Super Scale 輸出成 4K 影片。
輸出時間相比 RTX 4070 Ti 並不會落後 RTX 4080 太多,反而對於影音用戶則是要考量顯卡記憶體容量,以及平時專案的容量來挑選顯卡;至於這項目與 AMD 相比,則有著一段的效能差距。
第二段測試為雙 NVENC 編碼的 AV1 與 HEVC 編碼測試,測試專案是一段 44 秒的小短片,來至於 Blender Open Movie Project《Tears of Steel》,並有著 8k Prores442HQ 30FPS 與 4K Prores422HQ 30FPS 的影片,可用來測試輸出為 HEVC、AV1 編碼的效能。
輸出設定主要是使用 NVIDIA Encoder、Quality: Restrict to 80000 Kb/s、Encoding Profile: Main、Rate Control: Constant Bitrate、Preset: Faster、Tuning: High Quality、Two Pass: Disable 等輸出設定。
效能上在 4K30 輸出時 RTX 4070 Ti 與 RTX 4080 效能差距不大,但對比上一代 RTX 3080 在 HEVC 編碼上時間節省達 2x 倍之多。
尤其在 8K HEVC 輸出時 RTX 4070 Ti、RTX 4080 直接海放上一代的 RTX 3080,這無疑展現出雙編碼引擎的優勢,但相對的也要軟體支援才能解放這效能。
Adobe Premiere Pro 2022 影音剪輯軟體,採用自家開發的 Mercury Playback Engine GPU 加速,可藉助 GPU 的編碼引擎加速影像輸出速度。測試使用的專案為公司 1080p60fps 的開箱影片;而 BigMix4K 專案其採用 3 段 FinalAdjusted_MPE 1920×1080 的影像組成一段 4K 時間軸,進行 H.264、HEVC 格式輸出。
(測試的 Premiere Pro 2022 還未支援 RTX 40 雙編碼功能。)
由於 Premiere Pro 2022 還未支援 RTX 40 的雙編碼引擎,因此測試的效能與上一代 RTX 3080 差異並不明顯,甚至還有跑輸的狀況,這需要等待 Adobe 提供軟體更新後,才能展現出新一代 GPU 在輸出效能上的
↑ Adobe Premiere Pro 2022 輸出,時間越短越好。
Blender 是跨平台、開放源碼的 3D 創作工具,支援著各種 3D 作業:Modeling、Rigging、Animation、Simulation、Rendering、Compositing 與 Motion Tracking 等。而測試,則以 Blender Benchmark 3.3.0 進行 Demo 專案的渲染工作測試。
Blender Benchmark 3.4.0 測試,RTX 4070 Ti 相比 RTX 3080 運算性能提升 1.3x 倍,但相比 RTX 4080 則是降低了 -21% 的運算效能。
V-Ray Benchmark 是由 Chaos Group 所開發,V-Ray 是基於物理法則所設計的光線渲染軟體,而此工具可分別針對 CPU 與 GPU 進行光線追蹤的渲染圖像的運算測試。
V-Ray 測試,RTX 4070 Ti 比起 RTX 3080 有著 1.3x 倍的性能提升,相較於 RTX 4090 則是降低 -23% 的運算效能。
SPECviewperf 2020 基於專業應用所開發的標準繪圖效能測試工具,測試各式專業的計算機圖形軟體如:3ds Max、Catia、Creo、Energy、Maya、Medical、SNX、SolidWorks 等繪圖測試與工程模擬。
測試為 1920 x 1080 解析度、成績為 FPS。這效能表現則根據使用的工具有關,提供給專業工作者效能參考。
GIGABYTE GeForce RTX 4070 Ti EAGLE – 3DMark 跑分效能測試
3DMark Fire Strike 效能測試,為主流的 DirectX 11 API 的測試情境,分別測試 1080p、Extreme 1440p 與 Ultra 2160p 的效能。
RTX 4070 Ti 在 Fire Strike 達到 43411 分的成績,而 Ultra Graphics 的成績比起 RTX 3080 快了 1.24x 倍、輸給 RTX 4080 約 -21%;而 Extreme Graphics 則是贏 RTX 3080 約 1.27x 倍效能、輸給 RTX 4080 約 -19%。
只不過效能比較上,RTX 4070 Ti 還是輸給 RX 7900 XT 約 -20% 的效能。
3DMark Time Spy 則是採用 DirectX 12 API 所設計的測試情境,同樣是鎖定在 AAA 遊戲等級,分別測試 1440p 與 Extreme 2160p 的效能。
RTX 4070 Ti 在 Time Spy 達到 23421 分的總成績,比起 RTX 3080 有著 1.3x 倍的性能提升,同樣小輸給 RTX 4080 約 -21%;但也輸給 RX 7900 XT 約 -12% 的效能。
針對光線追蹤測試,3DMark Port Royal 在 AAA 遊戲中的場景中加入光線追蹤功能,考驗著新一代 GPU 對於硬體光線追蹤加速的能力。同時 DXR 測試,則是使用 DirectX Raytracing API 進行的功能測試;Speed Way 則是使用全光線追蹤所開發的測試情境。
RTX 4070 Ti 同樣不用 DLSS 也能有著相當不錯的光追效能,Port Royal 達到 66.27 FPS、DXR 68.9 FPS、Speed Way 54.96 FPS 的成績,比起 RTX 3080 有著 1.28x 倍的光追性能提升,但同樣小輸給 RTX 4080 約 -20% 的光追效能。
當然光追性能依然是 NVIDIA 的強項,RTX 4070 Ti 比起 RX 7900 XT 在光追性能領先 25% 的效能。
3DMark DLSS Feature Test 可針對 DLSS 3、DLSS 2 進行效能測試,設定為 3840 x 2160、Performance 加速設定。
RTX 4070 Ti 在 DLSS 2 可獲得 81.5 FPS 約 2.6x 倍的效能提升,而 DLSS 3 使用 AI 補幀的技術可達到 121.3 FPS 約 4x 倍的效能提升。
↑ 3DMark DLSS Feature Test,越高越好。
GIGABYTE GeForce RTX 4070 Ti EAGLE – 4 款電競遊戲效能測試
4 款電競遊戲《虹彩六號:圍攻行動》、《英雄聯盟》、《APEX 英雄》與《CS:GO》等,都是重技巧、團隊的戰術競技射擊、DOTA 類型的遊戲,因此遊戲畫質、細節不高的狀況下,遊戲 FPS 也都是平均百幀以上的表現。測試以 2160p、1440p、特效最高設定進行。
對於電競遊戲來說 RTX 4070 Ti 效能依舊綽綽有餘相當強悍,只不過目前在《CS:GO》效能偏低,但對於電競遊戲來說 4K、300 FPS 也不成問題。
GIGABYTE GeForce RTX 4070 Ti EAGLE – 11 款遊戲效能測試
11 款 AAA 遊戲平均效能,同樣測試 2160p、1440p、特效全開進行測試,這段測試僅 F1 2021 使用光追功能,其餘遊戲無光追下、無 DLSS 加速,測試 GPU 的實際傳統渲染遊戲效能。
遊戲測試名單有入門的《F1 2021》、《極限競速 地平線 5》賽車遊戲、《古墓奇兵:暗影》、電影遊戲《死亡擱淺》、《戰爭機器 5》、《全境封鎖 2》、《地平線:期待黎明》,以及吃重效能的《邊緣禁地 3》、《刺客教條:維京紀元》、《碧血狂殺 2》與《戰神》等測試。
RTX 4070 Ti 在 2160p、AAA 遊戲達到平均 91.9 FPS,比起 RTX 3080 平均 79.3 FPS,可達到約 1.1x 倍的效能升級,相較於 RTX 4080 則是小輸 -20% 的遊戲效能。只不過同樣輸給 RX 7900 XT 約 -9% 的遊戲效能。
接著 1440p 解析度下 RTX 4070 Ti 平均 157.32 FPS,比起 RTX 3080 快了 1.2x 倍,一樣小輸給 RTX 4090 約 -16%、輸給 RX 900 XT 約 -5% 的效能。
GIGABYTE GeForce RTX 4070 Ti EAGLE – 9 款光追遊戲測試
9 款光追 DXR 遊戲測試,則加入年度最佳遊戲《巫師 3:狂獵》次世代改版加入光追 DLSS 的支援,以及 NVIDIA 模改的《Portal with RTX》光追版本,還有著《電馭叛客 2077》、《控制》、《看門狗:自由軍團》、《戰慄深邃:流亡》、《蜘蛛人:麥爾斯·摩拉斯》、《漫威星際異攻隊》與《極地戰嚎 6》等遊戲進行測試。測試 2160P、1440p 解析度,特效 / 光追最高設定外,也會啟用 DLSS 加速,詳細設定請參考圖表說明。
RTX 4070 Ti 在 2160p 解析度、DLSS 3 加速下,讓《巫師 3:狂獵》達到平均 83 FPS、《Portal with RTX》平均 63 FPS、《電馭叛客 2077》平均 91 FPS 的出色效能;9 款光追遊戲平均可達 87.7 FPS。
RTX 4070 Ti 比起 RTX 3080 有著 1.37x 倍的光追遊戲效能升級,相比 RTX 4080 約降低 -19% 的光追遊戲效能,但比起 RX 7900 XT 則有著 62% 的光追效能領先。
至於 1440p 解析度,RTX 4070 Ti 平均 138.5 FPS,比起 RTX 3080 有著 39% 的遊戲效能升級,相比 RTX 4080 約降低 -14% 的效能。
GIGABYTE GeForce RTX 4070 Ti EAGLE – DLSS 3 效能實測
RTX 40 更新的一大重點「DLSS 3」,測試的遊戲包含《微軟模擬飛行》、《巫師 3:狂獵》、《蜘蛛人:麥爾斯·摩拉斯》、《F1® 22》、《Unity Enemies》與《電馭叛客 2077》,使用 2160p 解析度、光追最高設定。
DLSS 3 遊戲設定中,會有明確的「Super Resolution」與「Frame Generation」的選項,必須同時啟用兩這兩個功能才能使用 DLSS 3 的技術,而 RTX 30 / 20 系列的玩家,則只能開啟 Super Resolution 功能,Frame Generation 會無法啟用。
RTX 4070 Ti 通過 DLSS 3 加速,讓《電馭叛客 2077》可達到平均 88.4 FPS 約 4.2x 倍的性能提升;而《巫師 3:狂獵》同樣從 26 FPS 加速到 87 FPS 約 3.3x 倍的性能升級。
通過 DLSS 3 Performance 設定下 RTX 4070 Ti 可獲得 1.8x~4.2x 倍的遊戲效能提升,給予玩家更順暢、穩定的遊戲表現。
GIGABYTE GeForce RTX 4070 Ti EAGLE 功耗與溫度測量
顯卡的功耗與溫度測試,使用 Time Spy Stress test、Furmark 與《電馭叛客 2077》進行測試。功耗測量時使用 NVIDIA 提供的 PACT 工具,可監控 PCIe 插槽與電源 12V 提供的瓦數。
顯卡溫度方面,RTX 4070 Ti EAGLE 在壓力測試最高溫維持在 60.7°C,至於 2077 遊戲時溫度則會稍微降低 57°C,相比上一代 RTX 3080 的 76°C,這代的溫度表現可說是相當出色。
顯卡 TBP 功耗測試,在 Time Spy Stress test 時 RTX 4070 Ti EAGLE 平均達到 257.3W 的功耗,而 Furmark 4K Xtreme burn-in 測試下來到最高 280W,不過遊戲時 2077 僅 241W 的功耗,相比 RTX 3080 的 322W、RX 7900 XT 的 315W 功耗,只能說 RTX 4070 Ti 確實有著不錯的效能、溫度與功耗表現。
↑ RTX 4070 Ti EAGLE GPU TBP 功耗。
總結
NVIDIA GeForce RTX 4070 Ti 新一代的 4K 60 FPS 守門卡,11 款 AAA 遊戲平均 91.9 FPS、9 款光追遊戲 87.7 FPS 的亮眼成績,算上 DLSS 3 還可帶來 1.8x~4.2x 倍的效能提升,只不過還是難檔 RX 7900 XT 的爭鋒相對。
RTX 4070 Ti 性能相比 RTX 3080 約有 16% 一般遊戲效能提升,而光追效能升級則可達 62% 之多;除此之外,RTX 4070 Ti 是目前 RTX 40 系列當中,有著最好的光追遊戲性價的選擇,倘若不追 4K 100 FPS 的極致效能,那 RTX 4070 Ti 無疑是目前最划算的新卡。
而台灣首波 RTX 4070 Ti 建議售價 NT$ 28,990 元起的價格,雖然價格比當時 RTX 3080 要高出不少,但確有著更充裕的 4K 遊戲效能,對於追求 2160p 遊戲的玩家來說,這張確實是目前 RTX 40 系列當中 4K 光追性價最出色的一張。
只不過若依照這價位推算未來 RTX 4060 真的要 2 萬起的價格,對於主流、入門玩家來說確實相當驚人,但這就要看未來 NVIDIA 如何規劃了,從 2023 年開始真的要跟便宜的遊戲顯卡說掰掰了。