顯示卡、器

我 4K 100 FPS!NVIDIA GeForce RTX 4080 開箱測試報告 / 只需 300W 電翻 RTX 3080 Ti

NVIDIA 第二張可達到 4K、100 FPS 的遊戲顯示卡,NVIDIA GeForce RTX 4080 採用新一代 Ada Lovelace GPU 架構,帶來 Tensor Core 與 RT Core 升級,以及 DLSS 3 的 AI 補幀技術與 AV1 雙編碼引擎,滿足創作、遊戲玩家所需的強悍效能,並比起上一代有著出色的每瓦效能升級,只不過美金定價 $1199 元、台幣 NT$ 42,990 元起的價格,也是這代出色表現下必須要扛的必要之惡。

第二張 4K、100 FPS 的遊戲顯卡 NVIDIA GeForce RTX 4080

NVIDIA Ada Lovelace GPU 世代的第二張能夠滿足 4K、100 FPS 的遊戲顯卡 NVIDIA GeForce RTX 4080,有著 76 組 SM、9728 個 CUDA 核心、304 個 Tensor Core 與 76 個 RT Core,同樣有著高於 2.5GHz 的 Boost 時脈,以及 16GB GDDR6X 的高速記憶體,更只需 320W TGP 功耗。

而 RTX 4080 採用 AD103 GPU 但並非使用了完整核心,RTX 4080 僅 76 組 SM 單元,也意味著未來 RTX 4080 Ti 可能使用完整 AD103 GPU 具備 80 組 SM 單元。


↑ RTX 4090 與 RTX 4080 規格比較。


↑ AD103 完整核心架構圖。

 

從定價來比較 RTX 4080 其實是與上代 RTX 3080 Ti 相比,效能上可提供 1.28-1.59x 倍的升級,並有著更低的功耗與更好的 GPU 散熱表現;而與 RTX 4090 相比效能差距約抓在 -20%,因此 RTX 4090 與 RTX 4080 兩者有著相同的性價比,就讓旗艦玩家在高單價的顯卡中有更多選擇。

 

Ada Lovelace:製程時脈升級、精進光線追蹤與雙 AV1 Encode

這代 Ada 架構除了改進 SM 單元外,亦有著 GDDR6X 高速記憶體、第 4 代 Tensor Cores 提升 AI 推論效能、第 3 代 RT Core 提升光線追蹤的質量,以及第 8 代影音編碼器支援 AV1 硬體編碼功能,還有著 DLSS 3 所帶來的 2-4x 的效能升級。

詳細的 Ada 架構升級可參考上一篇「NVIDIA GeForce RTX 4090 測試報告」(https://news.xfastest.com/?p=119051),本篇就以重點摘要說明。

首先 Ada 第 4 代 Tensor Core 能夠帶來 2x 倍的 FP16、BF16、TF32、INT8 與 INT4 的 Tensor TFLOPS 效能提升,同時加入 Hopper 架構的 FP8 Transformer Engine,能提供 1.3 PetaFLOPS 的 Tensor Core 效能。


↑ Ada Lovelace。

 

而第 3 代 RT Core 能帶來 2x 倍快的 Ray-Triangle Intersection 輸出效能(相較於上代 Ampere),同時加入全新的 Opacity Micromap Engine、Displaced Micro-Mesh Engine 與 Shader Execution Reordering 等新技術,能夠再次提升光線追蹤的效能。


↑ Opacity Micromap Engine,讓物件能有透明、半透明、不透明的屬性,加速光追處理的效能。


↑ Displaced Micro-Mesh Engine,將物件採用較簡單的 BVH 表示,並依據向量地圖來快速算出物件的光追效果。


↑ Shader Execution Reordering,能夠優化 SM 處理光追的排程提升性能。

 

創作方面 Ada Lovelace 具備第 8 代雙 NVENC 編碼引擎,主要是加入 AV1 的影音編碼功能,而這代影音輸出能獲得 2x 倍的效能提升,需要影片編輯軟體支援像是 DaVinci Resolve、Voukoder、簡映都會在第一時間支援 RTX 40 的雙編碼引擎,至於主流的 Adobe Premiere Pro 則要等日後更新了。


↑ 第 8 代雙 NVENC 編碼引擎。

 

大加速時代 DLSS 3 與 Optical Flow Accelerator

RTX 40 獨有的「DLSS 3」則是基於 DLSS 2 的技術下,加入「AI 補幀」的概念,也就是納入 Optical Flow Accelerator 的功能。Optical Flow 是電腦視覺所使用的光流法,用來計算連續的影像中,每個像素的移動方向與移動量。

DLSS 3 技術則需要遊戲引擎提供:較低解析度的渲染畫面與 Motion Vectors,通過 DLSS 的深度學習網路推論出高解析度的影像,並將影像提供給 Optical Flow Accelerator 計算每個像素的移動方向與移動量,最後通過 Optical Multi Frame Generation 產生出 AI 補幀的畫面。

DLSS 3 通過 AI 補幀能夠提供 2-4x 倍的遊戲效能提升,同時維持著與原生渲染相似的畫質,但是也會增加遊戲的整體延遲,因此 NVIDIA 強制 DLSS 3 包含 Reflex 技術,藉由取消 Render Queue 讓 CPU 處理完 GPU 立刻接手渲染,達到更低的系統延遲效果。

因此 DLSS 3 結合 AI Super Resolution、Frame Generation 與 ReFlex 等技術,靠著第 4 代 Tensor Core、Optical Flow Accelerator,以及 NVIDIA 用來訓練 AI 的超級電腦,滿足次世代遊戲玩家 4K、100 FPS 的極致效能。


↑ DLSS 3。

 

NVIDIA GeForce RTX 4080 創始版顯示卡開箱 / 背面即是正面 經典再強化

NVIDIA GeForce RTX 4080 創始版延續著 RTX 4090 創始版的相同設計,「背面即是正面」、「少但更好」。而且新的外包裝也相當特殊,採用 2 個三角形、硬紙板打造的外盒,簡潔的印上 RTX 4080 與經典的 X 框架的線條。

打開後,RTX 4080 創始版被放在有著放射線條的斜面上,像是自帶梗圖背景的設計,與其說是買顯卡不如說是買電腦精品。


↑ 創始版與眾不同的外盒。


↑ RTX 4080 與放射狀的背景。


↑ 內部小抽屜則有配件與電源轉接線。

 

RTX 4080 創始版採用堅固、耐用的鋁合金打造 X-Frame 框架,表面採用陽極氧化處理帶來高級的質感與金色的金屬質感。

而框架內則是填滿散熱鰭片,內部則是均溫板替 GPU、VRAM 散熱,再藉由熱導管將廢熱引導至散熱鰭片。而 RTX 4080 創始版採用更大的 116mm、FDB、7 扇葉的雙風扇,並且增加顯卡厚度至 3-Slot、減少顯卡長度至 30.48cm(12 inch)。

這代均溫板也有著優化,並針對記憶體有著專屬的切口,讓均溫板可以更均勻的與 GPU 接觸,同時記憶體的導熱墊則降低至 1.5mm 帶來更好的熱傳導效應;這代散熱器可支援到 650W Qmax 的解熱能力。


↑ RTX 4080 正面外觀,比起上一代更精緻、細節處理的更好。


↑ RTX 4080 散熱器,可見 X 框架中鑲嵌著散熱鰭片。


↑ 顯卡上方側面,則有著 GEFORCE RTX 字樣的 Logo 燈與 PCIe 12+4 Pin(12VHPWR)供電介面。


↑ 顯卡前方磁鐵吸附隱藏的固定鎖孔。


↑ 顯卡下方側面。

 

RTX 4080 與 RTX 4090 相同使用 PCIe 12+4 Pin(12VHPWR)的供電介面,一線最高可傳輸 600W 的功耗。而 RTX 4080 配件中則提供了 1 條 12VHPWR 轉 3 個 PCIe 6+2pin 的連接線。

裝機時建議至少連接 3 個 PCIe 6+2pin 來轉換,若是新買電源建議選擇符合 ATX12 V3.0 與 EPS12V V2.92 規範的新電源,如此一來就可以將有點醜的沖天炮收起來,只要一條 12VHPWR 連接線即可提供顯卡所需的供電。


↑ RTX 4080 的 12VHPWR 轉 3 個 PCIe 6+2pin 的連接線。


↑ 連接線材時要確定整個插頭都有插入插座當中。


↑ 而線材出線處也不要過度折灣。


↑ 或者搭配原生 12VHPWR 連接線,一勞永逸。

 

RTX 4080 顯示輸出提供 1 個 HDMI 2.1a 支援 VRR、4K120Hz / 8K60Hz HDR,以及 3 個 DisplayPort 1.4a DSC 支援 12-bit 4K240Hz HDR / 12-bit 8K60Hz HDR 等輸出能力,最多同時連接 4 個螢幕輸出。


↑ RTX 4080 顯示輸出。

 

NVIDIA GeForce RTX 4080 創作影音輸出、GPU 渲染效能測試

此次測試包含創作 Adobe Premiere Pro 2020、DaVinci Resolve 18 與 Blender等創作測試,遊戲則以 2160p、1440p 解析度、特效全開測試電競、AAA 遊戲與光追遊戲的效能,以及 DLSS 3 的相關測試,同時比較 RTX 4090 與 RTX 3080 Ti,讓玩家有更多的數據參考。

測試平台
處理器:Intel Core i9-13900K
主機板:ASUS ROG MAXIMUS Z790 HERO 0502
記憶體:G.SKILL TRIDENT Z5 NEO DDR5-6000 16GBx2
顯示卡:NVIDIA GeForce RTX 4090 創始版、NVIDIA GeForce RTX 4080 創始版、NVIDIA GeForce RTX 3080 Ti 創始版
系統碟:Solidigm P41 Plus 1TB PCIe 4.0 SSD
散熱器:Phanteks Glacier One 360MPH
電源供應器:Seasonic PRIME PX-1000
作業系統:Windows 11 Pro 21H2 64bit、Resizable BAR On
驅動版本:NVIDIA 526.72

 

GPU-Z 還未能檢視 NVIDIA GeForce RTX 4080 資訊,其採用 4nm 製程的 AD103 GPU,有著 9728 個渲染 CUDA 核心,以及 16384 MB GDDR6X(Micron)記憶體,而 GPU 預設時脈 2205 MHz、Boost 2505 MHz。


↑ GPU-Z。

 

DaVinci Resolve 18 純粹通過 GPU 加速的影片剪輯程式,更包含強大的色彩校正與特效功能,並且直接使用 CUDA 核心運算,讓影片剪輯的回放與輸出都有著相當好的性能。測試版本則包含支援 NVIDIA AV1 編碼功能。


↑ DaVinci Resolve 18。

 

首先第一段測試的專案使用 4K Blackmagic RAW 影像,有著 Wedding_Heavy_Styles 時間軸,這段影片使用非常多的 Resolve 效果,像是 OFX: Light Rays / Glow / Sketch 等,輸出相當高風格的影片類型。

Bride_FaceRefine_Selective_Color 則使用 Face Refinement 做人臉的追蹤,並將主體新娘使用顏色凸顯;50% Retime 與 Optical Flow Enhanced Better 都使用 Optical Flow 技術降低影像 50% 速度。

SuperScale2x 4K Source 使用 4K ProRES 來源影片製作 2x Zoom In 主體的 4K 影片輸出;SuperScale4x HD_Source 則是使用 HD H.264 來源影片,利用 Resolve Super Scale 輸出成 4K 影片。

輸出效能肯定是 RTX 4090 更佳強悍,但 RTX 4080 的性能也不容小覷,就看各位的專案是否會用到 RTX 4090 這麼高的記憶體容量,倘若是一般常見的影片類型 RTX 4080 依舊可給予不錯的效能。


↑ DaVinci Resolve 18,時間越短越好。

 

第二段測試為雙 NVENC 編碼的 AV1 與 HEVC 編碼測試,測試專案是一段 44 秒的小短片,來至於 Blender Open Movie Project《Tears of Steel》,並有著 8k Prores442HQ 30FPS 與 4K Prores422HQ 30FPS 的影片,可用來測試輸出為 HEVC、AV1 編碼的效能。

輸出設定主要是使用 NVIDIA Encoder、Quality: Restrict to 80000 Kb/s、Encoding Profile: Main、Rate Control: Constant Bitrate、Preset: Faster、Tuning: High Quality、Two Pass: Disable 等輸出設定。

效能上在 4K30 輸出時 RTX 4090 與 RTX 4080 效能差距不大,但對比上一代 RTX 3090 Ti 在 HEVC 編碼上時間節省達 2x 倍之多。

尤其在 8K HEVC 輸出時 RTX 4090、RTX 4080 直接海放上一代的 RTX 3080 Ti,這無疑展現出雙編碼引擎的優勢,但相對的也要軟體支援才能解放這效能。


↑ DaVinci Resolve 18,時間越短越好。

 

Adobe Premiere Pro 2022 影音剪輯軟體,採用自家開發的 Mercury Playback Engine GPU 加速,可藉助 GPU 的編碼引擎加速影像輸出速度。測試使用的專案為公司 1080p60fps 的開箱影片;而 BigMix4K 專案其採用 3 段 FinalAdjusted_MPE 1920×1080 的影像組成一段 4K 時間軸,進行 H.264、HEVC 格式輸出。

(測試的 Premiere Pro 2022 還未支援 RTX 4090 雙編碼功能。)

由於 Premiere Pro 2022 還未支援 RTX 40 的雙編碼引擎,因此測試的效能與上一代 RTX 3080 Ti 差異並不明顯,需要等待 Adobe 提供軟體更新後,才能展現出新一代 GPU 在輸出效能上的


↑ Adobe Premiere Pro 2022。


↑ Adobe Premiere Pro 2022 輸出,時間越短越好。

 

Blender 是跨平台、開放源碼的 3D 創作工具,支援著各種 3D 作業:Modeling、Rigging、Animation、Simulation、Rendering、Compositing 與 Motion Tracking 等。而測試,則以 Blender Benchmark 3.3.0 進行 Demo 專案的渲染工作測試。

Blender Benchmark 3.3.0 測試,RTX 4080 相比 RTX 3080 Ti 運算性能提升 1.48x 倍,但相比 RTX 4090 則是降低了 -24% 的運算效能。


↑ Blender,效能越高越好。

 

V-Ray Benchmark 是由 Chaos Group 所開發,V-Ray 是基於物理法則所設計的光線渲染軟體,而此工具可分別針對 CPU 與 GPU 進行光線追蹤的渲染圖像的運算測試。

V-Ray 測試,RTX 4080 比起 RTX 3080 Ti 有著 1.4x 倍的性能提升,相較於 RTX 4090 則是降低 -30% 的運算效能。


↑ V-Ray Benchmark,效能越高越好。

 

SPECviewperf 2020 基於專業應用所開發的標準繪圖效能測試工具,測試各式專業的計算機圖形軟體如:3ds Max、Catia、Creo、Energy、Maya、Medical、SNX、SolidWorks 等繪圖測試與工程模擬。

測試為 1920 x 1080 解析度、成績為 FPS。這效能表現則根據使用的工具有關,RTX 4080 相比 RTX 4090 性能差異約在 -15%;但相比 RTX 3080 Ti 約有 1.3x 倍的性能提升。


↑ SPECviewperf 2020。

 

NVIDIA GeForce RTX 4080 – 3DMark 跑分效能測試

3DMark Fire Strike 效能測試,為主流的 DirectX 11 API 的測試情境,分別測試 1080p、Extreme 1440p 與 Ultra 2160p 的效能。

RTX 4080 在 Fire Strike 達到 46013 分的成績,而 Ultra Graphics 的成績比起 RTX 3080 Ti 快了 1.37x 倍、輸給 RTX 4090 約 -31%;而 Extreme Graphics 則是贏 RTX 3080 Ti 約 1.39x 倍效能、輸給 RTX 4090 約 -25%。


↑ 3DMark Fire Strike,分數越高越好。

 

3DMark Time Spy 則是採用 DirectX 12 API 所設計的測試情境,同樣是鎖定在 AAA 遊戲等級,分別測試 1440p 與 Extreme 2160p 的效能。

RTX 4080 在 Time Spy 達到 27569 分的總成績,比起 RTX 3080 Ti 有著 1.4x 倍的性能提升,同樣小輸給 RTX 4090 約 -26%。


↑ 3DMark Time Spy,分數越高越好。

 

針對光線追蹤測試,3DMark Port Royal 在 AAA 遊戲中的場景中加入光線追蹤功能,考驗著新一代 GPU 對於硬體光線追蹤加速的能力。同時 DXR 測試,則是使用 DirectX Raytracing API 進行的功能測試。

RTX 4080 即便不用 DLSS 也能有著相當驚人的光追效能,Port Royal 達到 82.3 FPS、DXR 84.2 FPS 的成績,比起 RTX 3080 Ti 有著 1.4x 倍的光追性能提升,但同樣小輸給 RTX 4090 約 -35% 的光追效能。


↑ 3DMark Port Royal,越高越好。

 

3DMark DLSS Feature Test 可針對 DLSS 3、DLSS 2 進行效能測試,設定為 3840 x 2160、Performance 加速設定。

RTX 4080 在 DLSS 2 可獲得 102.14 FPS 約 2.6x 倍的效能提升,而 DLSS 3 使用 AI 補幀的技術可達到 149.69 FPS 約 3.8x 倍的效能提升。


↑ 3DMark DLSS Feature Test,越高越好。

 

NVIDIA GeForce RTX 4080 – 4 款電競遊戲效能測試

4 款電競遊戲《虹彩六號:圍攻行動》、《英雄聯盟》、《APEX 英雄》與《CS:GO》等,都是重技巧、團隊的戰術競技射擊、DOTA 類型的遊戲,因此遊戲畫質、細節不高的狀況下,遊戲 FPS 也都是平均百幀以上的表現。測試以 2160p、1440p、特效最高設定進行。

對於電競遊戲來說 RTX 4080 效能依舊相當強悍,只不過目前在《CS:GO》效能偏低,NVIDIA 正在解決當中。對於電競遊戲來說 4K、400 FPS 也不成問題。


↑ 2160p 電競遊戲測試,FPS 越高越好。


↑ 1440p 電競遊戲測試,FPS 越高越好。

 

NVIDIA GeForce RTX 4080 – 11 款遊戲效能測試

11 款 AAA 遊戲平均效能,同樣測試 2160p、1440p、特效全開進行測試,這段測試僅 F1 2021 使用光追功能,其餘遊戲無光追下、無 DLSS 加速,測試 GPU 的實際傳統渲染遊戲效能。

遊戲測試名單有入門的《F1 2021》、《極限競速 地平線 5》賽車遊戲、《古墓奇兵:暗影》、電影遊戲《死亡擱淺》、《戰爭機器 5》、《全境封鎖 2》、《地平線:期待黎明》,以及吃重效能的《邊緣禁地 3》、《刺客教條:維京紀元》、《碧血狂殺 2》與《戰神》等測試。

RTX 4080 在 2160p、AAA 遊戲達到平均 114.4 FPS,比起 RTX 3080 Ti 平均 89.3 FPS,可達到平均約 1.2x 倍的效能升級,相較於 RTX 4090 則是小輸 -24% 的遊戲效能。

接著 1440p 解析度下 RTX 4080 平均 186 FPS,比起 RTX 3080 Ti 快了 1.2x 倍,一樣小輸給 RTX 4090 約 15%。


↑ 2160p AAA 遊戲測試,FPS 越高越好。


↑ 1440p AAA 遊戲測試,FPS 越高越好。

 

NVIDIA GeForce RTX 4080 – 8 款光追遊戲測試

8 款光追 DXR 遊戲測試,則使用最熱門的《電馭叛客 2077》、《控制》、《看門狗:自由軍團》、《戰慄深邃:流亡》、《漫威蜘蛛人重製版》、《漫威星際異攻隊》、《鬼線:東京》與《極地戰嚎 6》等遊戲進行測試。測試 2160P、1440p 解析度,特效 / 光追最高設定外,也會啟用 DLSS 加速,詳細設定請參考圖表說明。

RTX 4080 在 2160p、《電馭叛客 2077》DLSS 3 加速下可達到平均 113 FPS,而 8 款光追遊戲平均達 111.6 FPS,比起 RTX 3080 Ti 有著 1.4x 倍的遊戲效能升級,相比 RTX 4090 約降低 -21% 的效能。

至於 1440p 解析度,RTX 4080 平均 163.4 FPS,比起 RTX 3080 Ti 有著 1.ˇx 倍的遊戲效能升級,相比 RTX 4090 約降低 -14% 的效能。


↑ 2160p 光追遊戲測試,FPS 越高越好。


↑ 1440p 光追遊戲測試,FPS 越高越好。

 

NVIDIA GeForce RTX 4080 – DLSS 3 效能實測

RTX 40 更新的一大重點「DLSS 3」,測試的遊戲包含《微軟模擬飛行》、《瘟疫傳說:安魂曲》、《漫威蜘蛛人重製版》、《F1® 22》、《Unity Enemies》與《電馭叛客 2077》,使用 2160p 解析度、光追最高設定。

DLSS 3 遊戲設定中,會有明確的「Super Resolution」與「Frame Generation」的選項,必須同時啟用兩這兩個功能才能使用 DLSS 3 的技術,而 RTX 30 / 20 系列的玩家,則只能開啟 Super Resolution 功能,Frame Generation 會無法啟用。


↑ 《電馭叛客 2077》DLSS 3 設定。

 

RTX 4080 通過 DLSS 3 加速,《電馭叛客 2077》可達到平均 109 FPS 約 4x 倍的性能提升;而 Unity 引擎釋出的 Enemies 電影動畫,在即時光追渲染下靠著 DLSS 3 亦可達到 75 FPS 約 3.2x 倍的效能升級。

RTX 4080 在 DLSS 3 Performance 設定下,可達到約 1.9x~4x 倍的效能提升,平均下來約在 2.48x 倍左右。


↑ DLSS 3 遊戲效能測試,越高越好。

 

NVIDIA GeForce RTX 4080 功耗與溫度測量

顯卡的功耗與溫度測試,使用 Time Spy Stress test、Furmark 與《電馭叛客 2077》進行測試。功耗測量時使用 NVIDIA 提供的 PACT 工具,可監控 PCIe 插槽與電源 12V 提供的瓦數。

顯卡溫度方面,RTX 4080 創始版在壓力測試最高溫維持在 66.1°C,至於 2077 遊戲時溫度則會稍微降低 63°C,相比上一代 RTX 3080 Ti 的 73°C,這代的溫度表現可說是相當出色。


↑ RTX 4080 創始版 GPU 溫度。

顯卡 TBP 功耗測試,在 Time Spy Stress test 時 RTX 4080 平均達到 293.3W 的功耗,而 Furmark 4K Xtreme burn-in 測試下來到最高 317.2W,不過遊戲時 2077 僅 280W 的功耗,相比 RTX 3080 Ti 的 360W 功耗,只能說 RTX 4080 升級的相當漂亮。


↑ RTX 4080 創始版 GPU 功耗。

 

總結

NVIDIA 再次交出第二張 4K、100 FPS 的遊戲顯示卡 GeForce RTX 4080,11 款 AAA 遊戲平均 114.4 FPS、8 款光追遊戲 111.6 FPS 的亮眼成績,算上 DLSS 3 還可帶來 1.9x~4x 倍的效能提升,並且穩穩贏過比較的 RTX 3080 Ti 約 1.4x 倍的效能。

RTX 4080 的性能相比 RTX 4090 約降低了 -25%,但是兩者的定價差異也在 24% 左右,因此兩者的性價相當的情況下,就看各位創作者、遊戲玩家對於性能的要求、視訊記憶體的容量來決定了,不過 RTX 4080 相比之下只需 300W 的功耗就能有著 4K、100 FPS 的效能。

而台灣首波 RTX 4080 價格也以建議售價 NT$ 42,990 元起至最高 NT$ 49,990 元的價格帶,雖說美金定價與當時 RTX 3080 Ti 相當,但如今 RTX 4080 台灣售價也跟著提高的狀況下,對於追求 4K 遊戲的玩家來說,無疑需要更多的買卡預算了。

若依照這價位帶推算未來 RTX 4070 可能 3 萬起、RTX 4060 則要 2 萬起的價格,這真的能滿足普遍玩家對遊戲顯卡的期待嗎?RTX 40 系列採用 TSMC 4N 製程、Ada Lovelace 新架構,帶來紮實的效能提升,但也讓顯卡價位跟著飛升的狀況下,就問各位旗艦玩家預算是否足夠了。

延伸影片閱讀:  
Previous post

曜越全新CYCLEDESK 100智能電競桌:專為遊戲辦公打造,更為單車電競而生!

Next post

動感光圈再現!GIGABYTE AORUS GeForce RTX 4080 16GB MASTER 顯示卡

The Author

sinchen

sinchen

我是 Sinchen。