AMD採用CDNA架構的Arcturus GPU Radeon Instinct洩漏– 120個CU，7680核心，1200MHz HBM2時脈

Rogame發現了AMD的Radeon Instinct Arcturus GPU，它將擁有CDNA架構並瞄準伺服器市場。CDNA架構採用在下一代Radeon Instinct顯示卡中，將利用其經過計算優化的GPU設計為數據中心提供最高性能的Compute功能。

在AMD的Arcturus GPU大約在2018年曝光，這是AMD公司在推出任何7nm的GPU之前。而Radeon VII和Navi系列於2019年推出，並配備了7nm GPU，Navi是針對大眾消費市場的產品。

後來AMD透漏的下一代HPC和AI GPU將與消費類晶片分開設計。這意味著Arcturus GPU將只保留給數據中心市場。AMD最近在其Radeon CDNA架構路線圖中證實，所有採用CDNA的GPU都是專門為HPC和數據中心市場設計的，而Radeon RDNA GPU將為消費市場提供動力。

規格方面，先前AMD曾宣布Arcturus GPU將具有增加的快取，並且CU的數量將是Vega的兩倍。在擁有新CDNA架構的Radeon Instinct卡中，可以預期到Arcturus GPU將會支援數據中心以及其特定功能，例如XDLOP，Rapid Packed Math，New Vector ALU和BFloat16。

這部分的訊息是採用原型樣品的，因此最終規格可能會有所不同，但這是關鍵點：

採用Arcturus XL GPU
測試板的TDP為200W
高達32GB HBM2
HBM2記憶體時脈在1000-1200 MHz之間

日前Rogame再次發現了一塊採用Arcturus CDNA GPU的測試板，從它的外觀來看，該版本可提供120個CU，總共7680個處理器，GPU速度為878 MHz（750 MHz SOC）時脈）。該版本還擁有1200 MHz頻率的HBM2記憶體，因此如果我們看的是4096位元記憶體匯流排，那麼應該獲得1.2TB/s的頻寬，這是三星Aquabolt能夠提供的頻寬。但是NVIDIA和AMD很有可能最終會採用更快的HBM2E“ Flashbolt”標準，該標準將於今年投入生產，並能夠提供高達1.8TB/s的頻寬。

說到時脈速度，測試板的878 MHz相當的慢，因為我們看到過去的版本高達1334 MHz。以上述速度該晶片將擁有大約13.5 TFLOP的FP32計算能力，低於Radeon Instinct MI60以及我們在先前原型樣品中獲得的21 TFLOP。另外根據預計在今年晚些時候發佈的Ampere GPU，看來NVIDIA的Tesla 7nm GPU可能在計算性能方面佔據上風，因為據推測它們將的FP32將達到近36 TFLOP和FP64的18 TFLOP計算能力。

到目前為止AMD宣布CDNA的主要重點將是數據中心市場的性能，效率，功能和可擴充性。目前AMD的GCN架構已在這一市場中服務，但藉助CDNA，AMD將創建專門針對高性能計算，機器學習和HPC而優化的GPU。第一代CDNA GPU將採用第二代Infinity架構，並將利用ROCm（Radeon開放式計算平台）通過關鍵的優化和增強的可擴充性為數據中心提供動力。第二代Infinity架構將在單個節點中實現4-8 Way GPU連接，從而使新的Radeon Instinct可和諧執行。