備受矚目的 AMD Ryzen 處理器,終於在 3/2 號與各位玩家見面,AMD 花費 4 年的光陰、超過兩百萬小時的工程時間,首波推出旗艦款 8 核 16 緒 Ryzen 7 1800X、1700X 與 1700 處理器,迎戰 Intel 7700K、6900K 等旗艦處理器;AMD 此舉以多核心處理器,更低的市場價格對 Intel 宣戰,就讓我們先來瞭解 Ryzen 的故事與能耐,再來討論玩家該如何在處理器雙雄中抉擇。

關於 Ryzen 處理器 Zen 架構的幾件事

起初我們聽到「Zen」處理器架構,以及「Summit Ridge」的處理器代號,與全新的「AM4」腳位,而在接近上市之際,AMD 則以「Ryzen」做為產品名發表,而 Ryzen 這名字在發想時,時間正逢美國 NASA 的冥王星探測任務「New Horizons」新視野號,Horizons 這寓意與 AMD 對 Zen 的期望不謀而合,因此以 Horizons 的後半段 rizons 與 zen 結合,因此 Ryzen 因此而被創造出來。

而在 Ryzen 主視覺的圖像中,那像是書法揮毫的圓形則是「enso」,看似封閉但又開放的圓形,屬於日本禪宗圓書法的印象,帶有禪意並以閉合的圓代表完美,而圓中的開放處代表著成長,因此在處理器外盒、視覺設計,都能看到 Ryzen 配上 enso 書法禪圓的 logo。


↑ Ryzen 與橘紅色的 enso 禪圓。

讓我們再回到處理器上,衡量處理器效能,莫過於使用「Instructions per cycle, IPC」,也就是處理器每一個 cycle 可執行的指令數,AMD 在簡報中提到,Zen 架構比起上一代 Excavator,有著 52% 的 IPC 效能提升,且 Zen 採用全新 x86 架構設計,對於現今電腦應用:PC Gaming、主流多核應用、直播、製作者(Prosumer),有著更好的效能提升。

接著就從四個面向:Performance、Throughput、Efficiency 與 Scalability,與一個技術 AMD SenseMI 來一窺 Zen 處理器的微架構設計。


↑ AMD Ryzen 7 1800X 處理器 die shot。

效能 Performance

從 Zen Core 的架構圖來看,AMD 增強了 Branch Predictor(分支預測)功能,並經由 4-way 64K I-Cache 送給 Decode,而 Decode 在每週期可解碼 4 個指令,並儲存於 Micro-op Queue,再藉由 Op Cache 的幫助下,可每週期向 INT/FP Scheduler 傳送 6 ops/cycle 的指令。

核心運算單元,Integer 部分則針對 ALU / AGU 進行運算,並有著 4 個 Interger 運算單元;而 Floating Point 部分,則有兩個 ADD 與 MUL 單元;AMD 這樣的設計,期望核心有更好的指令平行處理能力,並有著 1.75X 大的指令 Scheduler 與 1.5X 的頻寬與資源,讓 Zen 能夠安排更多指令到執行單元,增強指令級平行運算性,以提升 Single-Thread 效能。


↑ Zen 核心框架圖。

吞吐量 Throughput

為了提升處理器的吞吐量,Zen 核心有著更大的 64KB L1 指令快取,與 32K L1 資料快取,以及每個核心專用的 512KB 指令/資料快取,而其中 8MB L3 快取則是由 4 個核心共用;此快取配置,不僅是上一代 Bulldozer 的翻倍大,也比起 Intel Broadwell-E處理器的快取還要大。

有著更大的快取空間,Zen 也加入一個複雜的 Learning Prefetcher,可預測應用程式需要的資料,並提早將資料存放於快取當中,讓核心可立刻執行指令;總而言之,將低層級快取設計於核心邊上,能讓每核心提升 5X 快取頻寬。


↑ 高頻寬、低延遲快取取設計。

Efficiency 效能

AMD Ryzn 處理器採用 Global Foundries 的 14nm FinFET 製程,不僅有更小的晶片尺寸,與更低的工作電壓,讓每瓦效能表現得更出色;且 Zen 架構採用 AMD 最新的低功耗設計,例如核心中的 Micro-op Cache 設計,可減少密集的遠程讀取功耗;更有效的動態功耗控制;以及低功耗位址產生器。

而 AMD 本身 APU 就屬於低功耗移動平台,Zen 的出現讓 AMD 能夠企及 HEDT(high-end desktop)領域。


↑ Zen 核心的面積、L2、L3 快取與對手比較。

Scalability 擴展性

Zen 架構在設計上採用 CPU Complex (CCX),有著原生 4C8T 區塊,且每一個 CCX 有著 64K L1 指令快取、64K L1 資料快取、512KB 該核心專用 L2 快取,以及 4 核心共享的 8MB L3 快取,且每一個 CCX 核心,都具備 SMT(Simultaneous Multithreading)多線程功能。

且 CCX 當中的核心不僅可擴張亦能禁用,像是 Ryzen 7 系列處理器,採用雙 CCX 設計,以打造 8C16T 多核心處理器,而兩組 CCX 互相通過高速 Infinity Fabric 進行溝通;這設計,讓 AMD 可根據需求擴張核心、線程與快取量,以符合客戶端、伺服器與 HPC 等市場。


↑ Zen CPU COMPLEX 設計。CPU COMPLEX 中有著 4 個核心,每顆核心有著獨立 L2 快取與共用的 L3 快取。

簡單來說 Infinity Fabric 是個靈活、高速的匯流排介面,除了 Ryzen 使用此技術之外,未來的 VEGA 與 APU 都將受益於 Infinity Fabric 的靈活性,將 AMD 複雜的 IP 產品集成至一個晶片當中;Infinity Fabric 可用於交換資料,例如 AMD Ryzen 處理器的兩組 CCX 相互傳遞資料、系統記憶體與其它控制器(I/O、PCIe);此外,Infinity Fabric 亦提供 Zen 處理器,更佳的控制與命令功能,另處理器可隨時針對電壓、溫度、時脈做出反應,這功能亦對於 AMD SenseMI 技術有著莫大的重要性。

AMD SenseMI 技術

在 AMD Ryzen 處理器當中,有著散佈式“smart grid” 傳感器,能夠精準的偵測 1mA、1mV、1mW 與 1℃,且回報率為 1000/1 秒;而傳感器會將資料,傳遞至 Infinity Fabric 連接的控制回路,讓控制器能基於當前和預期的方式,對處理器進行精準的調整。

AMD SenseMI 技術包含了五個相關的“senses” 功能,並通過學習智能與 Infinity Fabric 命令/控制功能,讓 AMD Ryzen 處理器具備 Machine Intelligence(MI)智能;這機制能夠微調核心效能與電壓,並提升快取預取與分支預測的能力。

Pure Power:透過分散式的傳感器,能夠帶給處理器精準電源控制,甚至依據每一顆處理器矽晶元的特性,來進行電源管理;簡而言之,Pure Power 能夠隨時監控溫度、時脈與電壓,透過 Infinity Fabric 回路,達到更精準的電源 / 效能控制。


↑ 通過這控制回路,可讓處理器的電源控制、時脈調教,更為精準達到更好的每瓦效能表現。

Precision Boost:根據 Infinity Fabric 回路回饋的電流、溫度與負載數據,能讓 Precision Boost 以每階 25MHz 提升或降低處理器時脈;這樣的 25MHz 步階設計,更容易提升時脈接近理想目標,並允許時脈更精準的抖動。


↑ 圖表中,處理器的時脈依據每階 25MHz 來進行調整。

Extended Frequency Range(XFR):每顆帶有 X 後綴的 Ryzen 處理器即支援 XFR,這代表著玩家只要有足夠的散熱系統,就能讓處理器自動提升時脈,超過處理器的 Boost 時脈;舉例來說,Ryzen 7 1800X 預設 3.4GHz、Boost 3.8GHz,而若玩家有足夠的解熱能力,更能讓處理器超頻至 3.8GHz+ 以上;這也是處理器 X 的意義,體質更好的超頻處理器。


↑ X 代表著更好的超頻效能,換句話說就是經過挑選超頻體質好的處理器。

Neural Net Prediction:AMD 提到 Ryzen 處理器當中,有著 AI 智能,並利用神經網路對應用行為進行學習,並猜測該應用可能的下一步;而 Prediction 預測,即是根據 CPU 的指令集,來預測其下一步,並提早準備好工作負載與資料。


↑ 根據指令的執行,處理器可預測下一步的指令,提高處理器的吞吐量。

Smart Prefetch:預取則是依據應用的模型與行為,預測其下一步所需的資料,並提早儲存於處理器的大型快取當中,讓處理器不用等待資料從記憶體讀進快取的時間。


↑ 預取則是根據應用,將下一步會使用到的資料,早一步讀入處理器的快取當中。

上述,僅對於 AMD Ryzen 處理器 Zen 架構的基本介紹,若各位對探討處理器架構有興趣,可參考 AMD 在 Hot Chips 2016 (HC28) 與 ISSCC 2017 的 Zen 簡報,已獲取更多的 Zen 架構資訊。

延伸影片閱讀:  
Previous post

Chrome 57 版本更新 提升電池續行與 CPU 效率

Next post

EVGA SC17 電競超頻筆電升級顯示卡並支援CPU,GPU,memory超頻

The Author

XFastest

XFastest