AMD Radeon繪圖技術資深副總裁王啟尚採訪:RDNA 3架構以突破性Chiplet小晶片設計打造最強每瓦效能
AMD Radeon RX 7900 系列顯示卡發表會後,AMD Radeon 繪圖技術事業群工程部資深副總裁王啟尚(David Wang)特別接受線上媒體訪談,解構RDNA 3架構以創新的Chiplet小晶片設計如何在 Radeon RX 7900 系列顯示卡中提升每瓦效能,讓小晶片也能發揮大大優勢。
↑ AMD Radeon 繪圖技術事業群工程部資深副總裁-王啟尚(David Wang)。
新一代 AMD Radeon RX 7900 系列顯示卡,不僅採用先進的 Chiplet 小晶片封裝技術,讓 AMD 能夠選擇正確的半導體製程工藝去實現這每瓦性能的目標。GPU 核心 GCD 採用最先進的 5nm 製程確保性能與功耗,而記憶體的控制器與 Infinity Cache 則採用較成熟的 6nm 製程打造 MCD,並藉由 5nm GCD 與 6nm MCD 的整合讓 RDNA 3 擁有 580 億個電晶體的驚人數量。
以往 AMD是最早嘗試在消費端產品推出使用 HBM 記憶體的 GPU,但為何這次 AMD 不使用 GDDR6X 的高速記憶體?
王啟尚解釋,其實原因就在於 6nm MCD 當中,AMD RDNA 3 採用的第 2 代 Infinity Cache 可有效幫助 GPU 暫存更多的資料,也因此 AMD 不需要用高功耗且昂貴的 GDDR6X 記憶體。而透過 Infinity Fabric 連接至 GCD 可達到 2.7x 倍的頻寬提升,而總記憶體頻寬可達到 5.3TB/s。
同時 RDNA 3 帶來全新的 Graphics Compute Die(GCD)設計,包含統一RDNA 3運算單元、新 Display Engine 顯示引擎、新雙媒體引擎(Dual Media Engine)。新一代核心中有著 Dual issue SIMD單元,可有著 2 倍指令發送速率,靈活的處理FP、Integer、AI 等運算,以及 AI 加速器與第 2 代光線追蹤加速器。
新加入的 AI加速器,每個 CU 裡面有著 2 個 AI 加速單元,能帶來 2.7x 倍的 AI 效能提升。而第 2 代光線追蹤加速技術,能讓每個 CU 提升 50% 的光追性能,並有著新設計的指令與 Ray Box Sorting 與 Traversal。
為了提升每瓦效能,RDNA 3 採用 Decoupled Clocks,讓 GPU 前端有著較高的 2.5GHz 時脈,可以更快速的處理指令、命令分配的效能,而 GPU 的 Shader 則運行在 2.3GHz,維持較高能效的頻率,藉此可節省 25% 的功耗與 15% 的時脈提升。
王啟尚也特別介紹RDNA 3 架構中全新的 AMD Radiance Display 引擎,將支援業界最新的 DisplayPort 2.1 的顯示輸出規格,顯示頻寬可達到 54 Gbps,點亮 8K165Hz、4K480Hz 的超高規格,而每通道 12bit 色彩可渲染出高達680億種顏色。這代也採用雙媒體引擎,除原本的 AVC / HEVC 編解碼外,也加入 AV1 編碼、解碼功能支援到 8K60Hz,以及 AI 加速的影音編碼功能。
王啟尚補充,雙媒體引擎技術可同時支援兩個編碼解碼的串流,為內容創作帶來莫大助力。與 AMD Radiance Display 引擎相同,雙媒體引擎支援最新的 AV1 編碼,並且在引擎效率增進1.8倍的助攻下,可節省一半的編碼解碼時間。
從 AMD 推出的引擎技術可以看出,AMD做到遊戲、內容創作、文書全面兼顧,以不斷精進的效率及技術支援滿足各方需求。
發表會中 AMD 也宣布與 3DMark 的合作,將推出「FidelityFX Super Resolution feature test 的功能測試項目。
其實 AMD 一直以來與 3DMark 的開發商 UL Benchmarks 有著良好的合作關係,而 3DMark 針對 DLSS、XeSS 等功能推出專屬測試情境,並擴展支援至 AMD FidelityFX Super Resolution (FSR)。
3DMark 將採用 FSR 2.2 技術,提供玩家測試 FSR 性能與對比影像畫質,讓玩家更能瞭解 FSR 技術所帶來的性能提升與畫質比較。
如今開源的加速技術 FidelityFX Super Resolution,已多達 216 款遊戲支援,主要原因在於 FSR 採用開源且不限制 GPU 硬體的加速技術,而且目前採用 FSR 2 的遊戲也已提升至 85 款支援,讓更多遊戲玩家能親自體驗 FSR 所帶來的加速體驗。
此外,AMD 將在 2023 年推出最新 FSR 3 更新,在基於 FSR 2 的技術中導入 Fluid Motion Frames 補幀技術,能讓遊戲效能可有著 2 倍提升,帶給遊戲玩家全新的 GPU 加速時代。
談到FSR,王啟尚也分享了AMD Software Adrenalin 軟體的更新,其中包括將於2023年上半年推出的AMD HYPR-RX一鍵式預設操作功能,可以一鍵同時開啟多個AMD Software功能,包括AMD Radeon Anti-Lag、AMD Radeon Boost以及AMD Radeon Super Resolution,讓這些功能同時工作,降低延遲,並提供比初始設置高達85%的更強效能。HYPR-RX在推出時將適用於AMD Radeon RX 7900系列顯卡,暫時不會支援Radeon RX 6000系列或之前的顯卡。
今年 3 大 GPU 廠商都推出全新架構的 GPU 產品,同時可見在混合渲染的趨勢下,GPU 必須同時處理渲染、光線追蹤、運算等指令,而對手紛紛使用 Thread Sorting Unit、Shader Execution Reordering 的優化機制提升效能。
AMD 並未採用這種將光線追蹤與光線渲染混合在一起的作法,畢竟從 RDNA 2 到 RDNA 3 在光線追蹤的效能與效率來看有著滿大的進步,因此不需要採用混合作法。
說到顯卡功耗,AMD Radeon RX 7900 XTX 其 TBP 需要 355W,相比上一代 RX 6950 XT 的 335W TBP 而言,僅提升了 20W 即可換來 61 TFLOPs 單精度運算性能、123 TFLOPs 半精度運算性能,理論性能提升可達上一代的 2.57x 倍之多。
王啟尚指出,AMD 在設計 Radeon RX 7900 系列顯卡時,希望性能與功耗能達到一個平衡點,為遊戲玩家與市場帶來更好的效能,並將旗艦的 Radeon RX 7900 XTX 設計在一定的電源範圍之內,因此玩家不需要額外的轉接電源接頭,只需標準的雙 PCIe 8-pin 供電,就能實現高效能的顯卡期望。
而從定價來看,Radeon RX 7900 XTX 是對應 GeForce RTX 4080 比較,目前GeForce RTX 4080 台灣售價NT$42990~49990元,而 Radeon RX 7900 XTX 有著較多的記憶體與較高的記憶體頻寬,一定有著更好的表現。
透過這次的說明會及採訪,不難瞭解AMD新一代RDNA 3架構帶來的劃世代效能躍進有多大,等上市後定能體驗到AMD Radeon RX 7900系列顯示卡的迅猛遊戲威力,敬請期待12月13日解鎖AMD出色遊戲效能!
前篇:AMD Radeon RX 7900 系列顯示卡以 Chiplet小晶片設計、新一代RDNA 3架構制霸每瓦性能