COMPUTEX 2024 InterviewIntel

Intel 新一代 AI PC 微架構 Lunar Lake 以 4P+4E, NPU 2, Xe2 達到 120 TOPS AI 運算效能

Intel 搶在 COMPUTEX 大展之前舉辦 Tech Tour Taiwan 揭曉今年 Client 產品規劃,新一代 AI PC 行動處理器 Lunar Lake 將在 Q3 登場、桌上型處理器更新 Arrow Lake 則是預計 Q4 推出。並鉅細靡遺的解說 Lunar Lake 新架構設計與技術細節。

 

Lunar Lake 有著嶄新的 x86 架構處理器的電源效率,降低將近 40% 的 SoC 電源,並且在核心架構改良的同時只需原本一半的功耗即可達成相同的單執行緒效能,並且擴大 1.5x 倍的繪圖核心區域,這也讓 Lunar Lake 有著全平台 120 TOPS 的 AI 運算效能。

 

Lunar Lake 基於 3D Foveros 多晶片封裝技術,將運算層、平台 I/O 層藉由 Foveros 與 Filler 層一同封裝在處理器基版上,並採用 Memory On Package 封裝,配置 32GB 記憶體。

Lunar Lake 的 32GB w/ 2 Ranks LPDDR5X 記憶體顆粒與處理器一同封裝在基版上,每晶片可有著 8.5GT/s 的傳輸頻寬、支援 16b x 4 通道,能夠降低 40% PHY 電源並節省 250mm2 的電路版面積。

 

Lunark Lake 微架構的核心目標是,提升核心的每瓦效能、更強悍的繪圖引擎、提升 AI 運算吞吐量與行動平台最重要的電源效率。

 

Lunark Lake 依然採用 Hybrid 核心架構設計,能帶來最好的效能與最大化效率,藉由 4 個 E-core 效率叢集與 4 個 P-core 效能叢集,組合成 8 核心混合設計。

 

P-core 效能叢集中每個核心有著 2.5MB L2 快取,以及 4 個核心共享的 12MB L3 快取,能帶來更出色的單執行緒效能,並優化核心 PPA 設計。

 

E-core 效率叢集則是 Intel 新設計的低功耗孤島(low power island),這邊孤島的意思是指獨立供電回路設計。4 個 E-core 共享 4MB L2 快取,能比上一代有著 2x 的省電表現,並比上一代提升 2x 的 Vector 與 AI 輸出效能。

 

新一代 Xe2 GPU 架構,具備 8 組新一代 Xe 核心、8 個光線追蹤單元、XMX AI 引擎與 8MB 快取。能提供 67 GPU TOPS 的算力、即時光線追蹤、XeSS 畫質提升、軟體堆疊等功能,相比上一代 Meteor Lake 能帶來 50% 的繪圖效能提升。

 

並有著新一代編碼設計除支援 AV1 編解碼之外,也支援最新的 VVC 解碼功能;3 個顯示輸出 eDP 1.5、DP 與 HDMI 2.1;內建的 IPU 可提供 temporal noise reduction、multi-frame 與 dual exposure staggered hdr 的影像強化功能。

 

Lunar Lake 的 NPU 神經網路處理器具備 6 個 Neural Compute 引擎、12 個強化 SHAVE DSP 數位訊號處理器與 9MB 快取,能夠提供 48 TOPS 的 AI 輔助與創作效能。

 

Lunar Lake 整平台有著 120 TOPS 的總算力,NPU 48 TOPS 能夠處理密集向量與矩陣運算,提供 AI 輔助與創作等功能;GPU 67 TOPS 運算能力藉由 XMX 與 DP4a 提供遊戲與創作 AI 所需的效能;至於 CPU 也可提供 5 TOPS 運算能力藉由 VNNI 與 AVX 指令驅動輕度 AI 工作。

 

稍微整理下 Lunar Lake 的核心架構層,採用新設計的 Lion Cove P-core、Skymont E-core、NPU 4 架構與 Xe2 GPU 架構,並整合新設計的編解碼引擎、顯示引擎與整合處理單元(IPU)。

 

Lunar Lake 在核心晶片中加入 8MB Memory side 快取,可以降低 DRAM 的傳輸次數並節省電源,藉由快取機制讓核心與 DRAM 間的延遲可降低並提升傳輸頻寬。

 

Lunar Lake 採用 4 個 PMIC 供電設計,可提供更多的供電路徑、動態電壓 ID 與更多的監控功能。針對 SoC 的供電使用優化達到最佳的效能效率。

 

針對電源管理則讓 Thread Director 更注重在效率的分配上,並依據不同赴載最佳電源平衡模式。

 

採用新的 PMIC 供電設計、Memory Side 快取、Thread Director 與新設計的 E-core 叢集下,Lunar Lake 比起上一代的 SoC 電源能夠降低 40%。

 

處理器的平台控制層則提供內建安全與新一代連接技術,像是 Intel Partner Security 引擎、Intel Silicon Security 引擎與 Converged Security 和 Manageability 引擎。

並整合 Wi-Fi 7、Bluetooth 5.4 與 1GbE MAC 連線技術;SoC 也提供 4x 條 PCIe 5.0 與 4x 條 PCIe 4.0 的擴充通道、3 個整合的 Thunderbolt 4、2 個 USB 3.0 與 6 個 USB 2.0 等連接埠。

 

至於 Lunar Lake 能夠結合 E-core、P-core、NPU 與 GPU 混合核心,主要原因在於採用 Scalable fabric gen 2 能夠提供跨架構的 IP 連接,採用統一的物理可擴充協定,並將 fabric access point 模組化的設計。

 

核心層通過 Scalable fabric gen 2 與 D2D 直接與平台控制層對接,能夠無縫的銜接運算節點、晶片層,讓核心能有著更好的擴展性與效率。

 

綜觀整個混合核心除了通過 Scalable fabric gen 2 連接外,也藉由 Home Agent 統籌整個層級的一致性(Hierarchical Coherency),包括 Memory Side 快取、每個核心叢集中的 Coherency Agent 包括平台控制層的 IO Coherency。

 

稍微整理下 Lunar Lake 採用新設計的 Lion Cove P-core、Skymont E-core 的 4P + 4E 混合核心設計,並藉助 Foveros 封裝技術整合運算層、平台控制層與 32GB 記憶體顆粒至單晶片當中,並有著最大設計的 NPU、全新設計的 Xe2 GPU 與編碼引擎、Memory side 快取、針對效率強化的 Thread Director 等設計,達到整平台 120 TOPS 的 AI 運算能力。

搭載新一代 Intel Lunar Lake 的輕薄筆電,很可能在今年 Q3 底、9 月左右的時間登場,但實際筆電發表、預購到消費者手中的時間則留待筆電製造商揭曉。

延伸影片閱讀:  
Previous post

2024年5月Steam硬體調查報告 RTX 3060繼續領先,32GB記憶體成為趨勢

Next post

迎廣在COMPUTEX展示第11代形象機殼,以「無限」為主題展望AI時代無限可能

The Author

sinchen

sinchen

我是 Sinchen。