我 4K 100 FPS!NVIDIA GeForce RTX 4080 開箱測試報告 / 只需 300W 電翻 RTX 3080 Ti
NVIDIA 第二張可達到 4K、100 FPS 的遊戲顯示卡,NVIDIA GeForce RTX 4080 採用新一代 Ada Lovelace GPU 架構,帶來 Tensor Core 與 RT Core 升級,以及 DLSS 3 的 AI 補幀技術與 AV1 雙編碼引擎,滿足創作、遊戲玩家所需的強悍效能,並比起上一代有著出色的每瓦效能升級,只不過美金定價 $1199 元、台幣 NT$ 42,990 元起的價格,也是這代出色表現下必須要扛的必要之惡。
內容目錄
第二張 4K、100 FPS 的遊戲顯卡 NVIDIA GeForce RTX 4080
NVIDIA Ada Lovelace GPU 世代的第二張能夠滿足 4K、100 FPS 的遊戲顯卡 NVIDIA GeForce RTX 4080,有著 76 組 SM、9728 個 CUDA 核心、304 個 Tensor Core 與 76 個 RT Core,同樣有著高於 2.5GHz 的 Boost 時脈,以及 16GB GDDR6X 的高速記憶體,更只需 320W TGP 功耗。
而 RTX 4080 採用 AD103 GPU 但並非使用了完整核心,RTX 4080 僅 76 組 SM 單元,也意味著未來 RTX 4080 Ti 可能使用完整 AD103 GPU 具備 80 組 SM 單元。
從定價來比較 RTX 4080 其實是與上代 RTX 3080 Ti 相比,效能上可提供 1.28-1.59x 倍的升級,並有著更低的功耗與更好的 GPU 散熱表現;而與 RTX 4090 相比效能差距約抓在 -20%,因此 RTX 4090 與 RTX 4080 兩者有著相同的性價比,就讓旗艦玩家在高單價的顯卡中有更多選擇。
Ada Lovelace:製程時脈升級、精進光線追蹤與雙 AV1 Encode
這代 Ada 架構除了改進 SM 單元外,亦有著 GDDR6X 高速記憶體、第 4 代 Tensor Cores 提升 AI 推論效能、第 3 代 RT Core 提升光線追蹤的質量,以及第 8 代影音編碼器支援 AV1 硬體編碼功能,還有著 DLSS 3 所帶來的 2-4x 的效能升級。
詳細的 Ada 架構升級可參考上一篇「NVIDIA GeForce RTX 4090 測試報告」(https://news.xfastest.com/?p=119051),本篇就以重點摘要說明。
首先 Ada 第 4 代 Tensor Core 能夠帶來 2x 倍的 FP16、BF16、TF32、INT8 與 INT4 的 Tensor TFLOPS 效能提升,同時加入 Hopper 架構的 FP8 Transformer Engine,能提供 1.3 PetaFLOPS 的 Tensor Core 效能。
而第 3 代 RT Core 能帶來 2x 倍快的 Ray-Triangle Intersection 輸出效能(相較於上代 Ampere),同時加入全新的 Opacity Micromap Engine、Displaced Micro-Mesh Engine 與 Shader Execution Reordering 等新技術,能夠再次提升光線追蹤的效能。
↑ Opacity Micromap Engine,讓物件能有透明、半透明、不透明的屬性,加速光追處理的效能。
↑ Displaced Micro-Mesh Engine,將物件採用較簡單的 BVH 表示,並依據向量地圖來快速算出物件的光追效果。
↑ Shader Execution Reordering,能夠優化 SM 處理光追的排程提升性能。
創作方面 Ada Lovelace 具備第 8 代雙 NVENC 編碼引擎,主要是加入 AV1 的影音編碼功能,而這代影音輸出能獲得 2x 倍的效能提升,需要影片編輯軟體支援像是 DaVinci Resolve、Voukoder、簡映都會在第一時間支援 RTX 40 的雙編碼引擎,至於主流的 Adobe Premiere Pro 則要等日後更新了。
大加速時代 DLSS 3 與 Optical Flow Accelerator
RTX 40 獨有的「DLSS 3」則是基於 DLSS 2 的技術下,加入「AI 補幀」的概念,也就是納入 Optical Flow Accelerator 的功能。Optical Flow 是電腦視覺所使用的光流法,用來計算連續的影像中,每個像素的移動方向與移動量。
DLSS 3 技術則需要遊戲引擎提供:較低解析度的渲染畫面與 Motion Vectors,通過 DLSS 的深度學習網路推論出高解析度的影像,並將影像提供給 Optical Flow Accelerator 計算每個像素的移動方向與移動量,最後通過 Optical Multi Frame Generation 產生出 AI 補幀的畫面。
DLSS 3 通過 AI 補幀能夠提供 2-4x 倍的遊戲效能提升,同時維持著與原生渲染相似的畫質,但是也會增加遊戲的整體延遲,因此 NVIDIA 強制 DLSS 3 包含 Reflex 技術,藉由取消 Render Queue 讓 CPU 處理完 GPU 立刻接手渲染,達到更低的系統延遲效果。
因此 DLSS 3 結合 AI Super Resolution、Frame Generation 與 ReFlex 等技術,靠著第 4 代 Tensor Core、Optical Flow Accelerator,以及 NVIDIA 用來訓練 AI 的超級電腦,滿足次世代遊戲玩家 4K、100 FPS 的極致效能。
NVIDIA GeForce RTX 4080 創始版顯示卡開箱 / 背面即是正面 經典再強化
NVIDIA GeForce RTX 4080 創始版延續著 RTX 4090 創始版的相同設計,「背面即是正面」、「少但更好」。而且新的外包裝也相當特殊,採用 2 個三角形、硬紙板打造的外盒,簡潔的印上 RTX 4080 與經典的 X 框架的線條。
打開後,RTX 4080 創始版被放在有著放射線條的斜面上,像是自帶梗圖背景的設計,與其說是買顯卡不如說是買電腦精品。
RTX 4080 創始版採用堅固、耐用的鋁合金打造 X-Frame 框架,表面採用陽極氧化處理帶來高級的質感與金色的金屬質感。
而框架內則是填滿散熱鰭片,內部則是均溫板替 GPU、VRAM 散熱,再藉由熱導管將廢熱引導至散熱鰭片。而 RTX 4080 創始版採用更大的 116mm、FDB、7 扇葉的雙風扇,並且增加顯卡厚度至 3-Slot、減少顯卡長度至 30.48cm(12 inch)。
這代均溫板也有著優化,並針對記憶體有著專屬的切口,讓均溫板可以更均勻的與 GPU 接觸,同時記憶體的導熱墊則降低至 1.5mm 帶來更好的熱傳導效應;這代散熱器可支援到 650W Qmax 的解熱能力。
↑ RTX 4080 正面外觀,比起上一代更精緻、細節處理的更好。
↑ RTX 4080 散熱器,可見 X 框架中鑲嵌著散熱鰭片。
↑ 顯卡上方側面,則有著 GEFORCE RTX 字樣的 Logo 燈與 PCIe 12+4 Pin(12VHPWR)供電介面。
RTX 4080 與 RTX 4090 相同使用 PCIe 12+4 Pin(12VHPWR)的供電介面,一線最高可傳輸 600W 的功耗。而 RTX 4080 配件中則提供了 1 條 12VHPWR 轉 3 個 PCIe 6+2pin 的連接線。
裝機時建議至少連接 3 個 PCIe 6+2pin 來轉換,若是新買電源建議選擇符合 ATX12 V3.0 與 EPS12V V2.92 規範的新電源,如此一來就可以將有點醜的沖天炮收起來,只要一條 12VHPWR 連接線即可提供顯卡所需的供電。
↑ RTX 4080 的 12VHPWR 轉 3 個 PCIe 6+2pin 的連接線。
RTX 4080 顯示輸出提供 1 個 HDMI 2.1a 支援 VRR、4K120Hz / 8K60Hz HDR,以及 3 個 DisplayPort 1.4a DSC 支援 12-bit 4K240Hz HDR / 12-bit 8K60Hz HDR 等輸出能力,最多同時連接 4 個螢幕輸出。
NVIDIA GeForce RTX 4080 創作影音輸出、GPU 渲染效能測試
此次測試包含創作 Adobe Premiere Pro 2020、DaVinci Resolve 18 與 Blender等創作測試,遊戲則以 2160p、1440p 解析度、特效全開測試電競、AAA 遊戲與光追遊戲的效能,以及 DLSS 3 的相關測試,同時比較 RTX 4090 與 RTX 3080 Ti,讓玩家有更多的數據參考。
測試平台
處理器:Intel Core i9-13900K
主機板:ASUS ROG MAXIMUS Z790 HERO 0502
記憶體:G.SKILL TRIDENT Z5 NEO DDR5-6000 16GBx2
顯示卡:NVIDIA GeForce RTX 4090 創始版、NVIDIA GeForce RTX 4080 創始版、NVIDIA GeForce RTX 3080 Ti 創始版
系統碟:Solidigm P41 Plus 1TB PCIe 4.0 SSD
散熱器:Phanteks Glacier One 360MPH
電源供應器:Seasonic PRIME PX-1000
作業系統:Windows 11 Pro 21H2 64bit、Resizable BAR On
驅動版本:NVIDIA 526.72
GPU-Z 還未能檢視 NVIDIA GeForce RTX 4080 資訊,其採用 4nm 製程的 AD103 GPU,有著 9728 個渲染 CUDA 核心,以及 16384 MB GDDR6X(Micron)記憶體,而 GPU 預設時脈 2205 MHz、Boost 2505 MHz。
DaVinci Resolve 18 純粹通過 GPU 加速的影片剪輯程式,更包含強大的色彩校正與特效功能,並且直接使用 CUDA 核心運算,讓影片剪輯的回放與輸出都有著相當好的性能。測試版本則包含支援 NVIDIA AV1 編碼功能。
首先第一段測試的專案使用 4K Blackmagic RAW 影像,有著 Wedding_Heavy_Styles 時間軸,這段影片使用非常多的 Resolve 效果,像是 OFX: Light Rays / Glow / Sketch 等,輸出相當高風格的影片類型。
Bride_FaceRefine_Selective_Color 則使用 Face Refinement 做人臉的追蹤,並將主體新娘使用顏色凸顯;50% Retime 與 Optical Flow Enhanced Better 都使用 Optical Flow 技術降低影像 50% 速度。
SuperScale2x 4K Source 使用 4K ProRES 來源影片製作 2x Zoom In 主體的 4K 影片輸出;SuperScale4x HD_Source 則是使用 HD H.264 來源影片,利用 Resolve Super Scale 輸出成 4K 影片。
輸出效能肯定是 RTX 4090 更佳強悍,但 RTX 4080 的性能也不容小覷,就看各位的專案是否會用到 RTX 4090 這麼高的記憶體容量,倘若是一般常見的影片類型 RTX 4080 依舊可給予不錯的效能。
第二段測試為雙 NVENC 編碼的 AV1 與 HEVC 編碼測試,測試專案是一段 44 秒的小短片,來至於 Blender Open Movie Project《Tears of Steel》,並有著 8k Prores442HQ 30FPS 與 4K Prores422HQ 30FPS 的影片,可用來測試輸出為 HEVC、AV1 編碼的效能。
輸出設定主要是使用 NVIDIA Encoder、Quality: Restrict to 80000 Kb/s、Encoding Profile: Main、Rate Control: Constant Bitrate、Preset: Faster、Tuning: High Quality、Two Pass: Disable 等輸出設定。
效能上在 4K30 輸出時 RTX 4090 與 RTX 4080 效能差距不大,但對比上一代 RTX 3090 Ti 在 HEVC 編碼上時間節省達 2x 倍之多。
尤其在 8K HEVC 輸出時 RTX 4090、RTX 4080 直接海放上一代的 RTX 3080 Ti,這無疑展現出雙編碼引擎的優勢,但相對的也要軟體支援才能解放這效能。
Adobe Premiere Pro 2022 影音剪輯軟體,採用自家開發的 Mercury Playback Engine GPU 加速,可藉助 GPU 的編碼引擎加速影像輸出速度。測試使用的專案為公司 1080p60fps 的開箱影片;而 BigMix4K 專案其採用 3 段 FinalAdjusted_MPE 1920×1080 的影像組成一段 4K 時間軸,進行 H.264、HEVC 格式輸出。
(測試的 Premiere Pro 2022 還未支援 RTX 4090 雙編碼功能。)
由於 Premiere Pro 2022 還未支援 RTX 40 的雙編碼引擎,因此測試的效能與上一代 RTX 3080 Ti 差異並不明顯,需要等待 Adobe 提供軟體更新後,才能展現出新一代 GPU 在輸出效能上的
↑ Adobe Premiere Pro 2022 輸出,時間越短越好。
Blender 是跨平台、開放源碼的 3D 創作工具,支援著各種 3D 作業:Modeling、Rigging、Animation、Simulation、Rendering、Compositing 與 Motion Tracking 等。而測試,則以 Blender Benchmark 3.3.0 進行 Demo 專案的渲染工作測試。
Blender Benchmark 3.3.0 測試,RTX 4080 相比 RTX 3080 Ti 運算性能提升 1.48x 倍,但相比 RTX 4090 則是降低了 -24% 的運算效能。
V-Ray Benchmark 是由 Chaos Group 所開發,V-Ray 是基於物理法則所設計的光線渲染軟體,而此工具可分別針對 CPU 與 GPU 進行光線追蹤的渲染圖像的運算測試。
V-Ray 測試,RTX 4080 比起 RTX 3080 Ti 有著 1.4x 倍的性能提升,相較於 RTX 4090 則是降低 -30% 的運算效能。
SPECviewperf 2020 基於專業應用所開發的標準繪圖效能測試工具,測試各式專業的計算機圖形軟體如:3ds Max、Catia、Creo、Energy、Maya、Medical、SNX、SolidWorks 等繪圖測試與工程模擬。
測試為 1920 x 1080 解析度、成績為 FPS。這效能表現則根據使用的工具有關,RTX 4080 相比 RTX 4090 性能差異約在 -15%;但相比 RTX 3080 Ti 約有 1.3x 倍的性能提升。
NVIDIA GeForce RTX 4080 – 3DMark 跑分效能測試
3DMark Fire Strike 效能測試,為主流的 DirectX 11 API 的測試情境,分別測試 1080p、Extreme 1440p 與 Ultra 2160p 的效能。
RTX 4080 在 Fire Strike 達到 46013 分的成績,而 Ultra Graphics 的成績比起 RTX 3080 Ti 快了 1.37x 倍、輸給 RTX 4090 約 -31%;而 Extreme Graphics 則是贏 RTX 3080 Ti 約 1.39x 倍效能、輸給 RTX 4090 約 -25%。
3DMark Time Spy 則是採用 DirectX 12 API 所設計的測試情境,同樣是鎖定在 AAA 遊戲等級,分別測試 1440p 與 Extreme 2160p 的效能。
RTX 4080 在 Time Spy 達到 27569 分的總成績,比起 RTX 3080 Ti 有著 1.4x 倍的性能提升,同樣小輸給 RTX 4090 約 -26%。
針對光線追蹤測試,3DMark Port Royal 在 AAA 遊戲中的場景中加入光線追蹤功能,考驗著新一代 GPU 對於硬體光線追蹤加速的能力。同時 DXR 測試,則是使用 DirectX Raytracing API 進行的功能測試。
RTX 4080 即便不用 DLSS 也能有著相當驚人的光追效能,Port Royal 達到 82.3 FPS、DXR 84.2 FPS 的成績,比起 RTX 3080 Ti 有著 1.4x 倍的光追性能提升,但同樣小輸給 RTX 4090 約 -35% 的光追效能。
3DMark DLSS Feature Test 可針對 DLSS 3、DLSS 2 進行效能測試,設定為 3840 x 2160、Performance 加速設定。
RTX 4080 在 DLSS 2 可獲得 102.14 FPS 約 2.6x 倍的效能提升,而 DLSS 3 使用 AI 補幀的技術可達到 149.69 FPS 約 3.8x 倍的效能提升。
↑ 3DMark DLSS Feature Test,越高越好。
NVIDIA GeForce RTX 4080 – 4 款電競遊戲效能測試
4 款電競遊戲《虹彩六號:圍攻行動》、《英雄聯盟》、《APEX 英雄》與《CS:GO》等,都是重技巧、團隊的戰術競技射擊、DOTA 類型的遊戲,因此遊戲畫質、細節不高的狀況下,遊戲 FPS 也都是平均百幀以上的表現。測試以 2160p、1440p、特效最高設定進行。
對於電競遊戲來說 RTX 4080 效能依舊相當強悍,只不過目前在《CS:GO》效能偏低,NVIDIA 正在解決當中。對於電競遊戲來說 4K、400 FPS 也不成問題。
NVIDIA GeForce RTX 4080 – 11 款遊戲效能測試
11 款 AAA 遊戲平均效能,同樣測試 2160p、1440p、特效全開進行測試,這段測試僅 F1 2021 使用光追功能,其餘遊戲無光追下、無 DLSS 加速,測試 GPU 的實際傳統渲染遊戲效能。
遊戲測試名單有入門的《F1 2021》、《極限競速 地平線 5》賽車遊戲、《古墓奇兵:暗影》、電影遊戲《死亡擱淺》、《戰爭機器 5》、《全境封鎖 2》、《地平線:期待黎明》,以及吃重效能的《邊緣禁地 3》、《刺客教條:維京紀元》、《碧血狂殺 2》與《戰神》等測試。
RTX 4080 在 2160p、AAA 遊戲達到平均 114.4 FPS,比起 RTX 3080 Ti 平均 89.3 FPS,可達到平均約 1.2x 倍的效能升級,相較於 RTX 4090 則是小輸 -24% 的遊戲效能。
接著 1440p 解析度下 RTX 4080 平均 186 FPS,比起 RTX 3080 Ti 快了 1.2x 倍,一樣小輸給 RTX 4090 約 15%。
NVIDIA GeForce RTX 4080 – 8 款光追遊戲測試
8 款光追 DXR 遊戲測試,則使用最熱門的《電馭叛客 2077》、《控制》、《看門狗:自由軍團》、《戰慄深邃:流亡》、《漫威蜘蛛人重製版》、《漫威星際異攻隊》、《鬼線:東京》與《極地戰嚎 6》等遊戲進行測試。測試 2160P、1440p 解析度,特效 / 光追最高設定外,也會啟用 DLSS 加速,詳細設定請參考圖表說明。
RTX 4080 在 2160p、《電馭叛客 2077》DLSS 3 加速下可達到平均 113 FPS,而 8 款光追遊戲平均達 111.6 FPS,比起 RTX 3080 Ti 有著 1.4x 倍的遊戲效能升級,相比 RTX 4090 約降低 -21% 的效能。
至於 1440p 解析度,RTX 4080 平均 163.4 FPS,比起 RTX 3080 Ti 有著 1.ˇx 倍的遊戲效能升級,相比 RTX 4090 約降低 -14% 的效能。
NVIDIA GeForce RTX 4080 – DLSS 3 效能實測
RTX 40 更新的一大重點「DLSS 3」,測試的遊戲包含《微軟模擬飛行》、《瘟疫傳說:安魂曲》、《漫威蜘蛛人重製版》、《F1® 22》、《Unity Enemies》與《電馭叛客 2077》,使用 2160p 解析度、光追最高設定。
DLSS 3 遊戲設定中,會有明確的「Super Resolution」與「Frame Generation」的選項,必須同時啟用兩這兩個功能才能使用 DLSS 3 的技術,而 RTX 30 / 20 系列的玩家,則只能開啟 Super Resolution 功能,Frame Generation 會無法啟用。
RTX 4080 通過 DLSS 3 加速,《電馭叛客 2077》可達到平均 109 FPS 約 4x 倍的性能提升;而 Unity 引擎釋出的 Enemies 電影動畫,在即時光追渲染下靠著 DLSS 3 亦可達到 75 FPS 約 3.2x 倍的效能升級。
RTX 4080 在 DLSS 3 Performance 設定下,可達到約 1.9x~4x 倍的效能提升,平均下來約在 2.48x 倍左右。
NVIDIA GeForce RTX 4080 功耗與溫度測量
顯卡的功耗與溫度測試,使用 Time Spy Stress test、Furmark 與《電馭叛客 2077》進行測試。功耗測量時使用 NVIDIA 提供的 PACT 工具,可監控 PCIe 插槽與電源 12V 提供的瓦數。
顯卡溫度方面,RTX 4080 創始版在壓力測試最高溫維持在 66.1°C,至於 2077 遊戲時溫度則會稍微降低 63°C,相比上一代 RTX 3080 Ti 的 73°C,這代的溫度表現可說是相當出色。
顯卡 TBP 功耗測試,在 Time Spy Stress test 時 RTX 4080 平均達到 293.3W 的功耗,而 Furmark 4K Xtreme burn-in 測試下來到最高 317.2W,不過遊戲時 2077 僅 280W 的功耗,相比 RTX 3080 Ti 的 360W 功耗,只能說 RTX 4080 升級的相當漂亮。
總結
NVIDIA 再次交出第二張 4K、100 FPS 的遊戲顯示卡 GeForce RTX 4080,11 款 AAA 遊戲平均 114.4 FPS、8 款光追遊戲 111.6 FPS 的亮眼成績,算上 DLSS 3 還可帶來 1.9x~4x 倍的效能提升,並且穩穩贏過比較的 RTX 3080 Ti 約 1.4x 倍的效能。
RTX 4080 的性能相比 RTX 4090 約降低了 -25%,但是兩者的定價差異也在 24% 左右,因此兩者的性價相當的情況下,就看各位創作者、遊戲玩家對於性能的要求、視訊記憶體的容量來決定了,不過 RTX 4080 相比之下只需 300W 的功耗就能有著 4K、100 FPS 的效能。
而台灣首波 RTX 4080 價格也以建議售價 NT$ 42,990 元起至最高 NT$ 49,990 元的價格帶,雖說美金定價與當時 RTX 3080 Ti 相當,但如今 RTX 4080 台灣售價也跟著提高的狀況下,對於追求 4K 遊戲的玩家來說,無疑需要更多的買卡預算了。
若依照這價位帶推算未來 RTX 4070 可能 3 萬起、RTX 4060 則要 2 萬起的價格,這真的能滿足普遍玩家對遊戲顯卡的期待嗎?RTX 40 系列採用 TSMC 4N 製程、Ada Lovelace 新架構,帶來紮實的效能提升,但也讓顯卡價位跟著飛升的狀況下,就問各位旗艦玩家預算是否足夠了。