Arm 為新世代 AI 運算推出新軟硬體組合的終端產品運算子系統
針對行動裝置提供更多 AI 應用,Arm 宣布推出終端產品運算子系統,包括新的運算核心與繪圖處理器組合之外,也特別推出 Kleidi 函式庫以發揮強大的運算能力。
在生成式 AI 熱潮之下,各種裝置都加入不同程度的人工智慧功能,其中行動裝置更是加上許多功能,包括影像處理、互動簡訊,新一代的機種更加入即時翻譯、語音轉文字等功能,讓使用者擁有更方便的使用體驗。在行動裝置運用更多 AI 功能之下,需要的運算資源就更多,為了提供更強的功能,勢必要採用更強大的處理器,但仍要考量功耗的重要因素。
(左起)Arm 應用工程總監徐達勇、Arm 終端產品事業部產品管理副總經理 James McNiven 及 Arm 台灣總裁曾志光
目前行動裝置幾乎都是採用 Arm 架構產品,擁有高性能與低功耗的特色,這樣的特色也適合用於新世代的筆記型電腦、可穿戴裝置、智慧電視等終端使用,更重要是有普及的開發生態。為了讓行動裝置能夠擁有更強大的 AI 運算能力,Arm 宣布推出新的終端產品運算子系統(CSS for Client)運算平台。
Arm 為 AI 時代推出新的終端產品運算子系統(CSS for Client)採用最新 Armv9.2 架構提供高運算性能、效率與安全
新的終端產品運算子系統是針對生成式 AI 而設計,擁有極佳的性能與能源效率,並首次採用 CPU 與 GPU 最佳化的布局,更與領先的晶圓製造商合作,最佳化整個設計以適應新的 3nm 製程。比較特別是新的終端產品運算子系統以實體形式提供 IP,但仍可讓客戶擁有客製化的設計。針對客戶不同的應用,Arm 提供三種不同的 CPU 架構與 GPU 選項,還包括 CPU 類型、快取記憶體大小等都有靈活的選擇空間。
新終端產品運算子系統是為 AI 與資安而設計的平台,採用最新的 Armv9.2 架構版本,並有最新的 CPU 與 GPU 組合,是目前最快速的 Arm 運算平台,提升 30% 以上的運算及繪圖效能,以因應實際應用時複雜的 Android 工作負載,並以加快 59% 速度的 AI 推論,處理更廣大的 AI 機器學習和電腦視覺工作負載。
Cortex-X925 是 Cortex-X 系列性能最高的產品
新的 CSS 提供功能多樣的 CPU 叢集,擁有最高的效能及功耗效率。其中做為 Cortex-X4 後繼者的 Arm Cortex-X925 是 Cortex-X 系列最新且性能最高的產品,是此系列中首款採用新的命名方式。以 3nm 製程工作時脈為 3.8GHz 並擁有最大快取記憶體的 Cortex-X925 為例,相比去年同期產品其 CPU 時脈周期指令數(IPC)有二位數的提升。與2023年使用 4nm 製程應用於旗艦級智慧手機的單晶片相比,單執行緒效能提升 36%。在 AI 運算效能更有驚人的 41% 提升,大幅提升裝置內生成式 AI 如大型語言模型(LLM)的反應速度。
Cortex-X925 性能的提升包括新製程以及微架構的改變,擁有至今為止最寬的解碼和向量設計,讓 AI TOPS 提升 50%。另外它還強化可配置性和更大的私有 L2 快取最大容量達 3MB,並保留進出 CPU 的指令和資料。
Arm Cortex-A725 與 A520 也比之前產品具有更好的電源使用效率
新的 Arm Cortex-A725 CPU 也持續追求效能與效率提升,其效能效率提升 35%,目標鎖定 AI 及手機遊戲等應用。而更新的小核 Arm Cortex-A520 CPU 及 DSU-120,讓採用最新 Armv9 CPU 叢集的消費性裝置,得以提升功耗效率及擴充性。
Arm Immortalis-G925 GPU 是 Arm 目前性能最強的 GPU
Arm Immortalis-G925 GPU 是 Arm 目前效能及效率最高的繪圖處理器(GPU),在各種頂尖的手機遊戲效能提升 37%,且多種 AI 及機器學習網路效能也提升 34%。此外它的光線追蹤效能提升,在複雜物體上的光線追蹤效能提高達 52%。Immortalis-G925 可應用於旗艦級智慧手機市場,而包括 Arm Mali-G725 和 Mali-G625 GPU 在內的全新高擴展性繪圖處理器系列,則鎖定更廣大的消費性市場,涵蓋高階行動手持裝置、智慧型手錶及 XR 穿戴式裝置。
Arm 新推出 Arm Kleidi 函式庫讓開發人員更快速推出 AI 相關應用
在新的硬體之外,Arm 也針對全球數百萬開發人員提供可高效快速創建下一波 AI 應用所需的效能、工具和軟體函式庫,特別新推出 Arm Kleidi 函式庫,其中包括針對 AI 工作負載的 KleidiAI 和針對電腦視覺應用的 KleidiCV。
KleidiAI 可支援所有 Arm CPU ,並與現行熱門的 AI 框架整合
KleidiAI 是為 AI 框架開發人員設計的運算核心,可無縫存取 Arm CPU 上的最佳效能,適用於各種裝置,並支援 NEON、SVE2 和 SME2 等關鍵 Arm 架構特性。KleidiAI 與現行熱門的 AI 框架整合,例如 PyTorch、TensorFlow 和 MediaPipe,以促進主要模型包括 Meta Llama 3 和 Phi-3的加速。更重要是它還能向前及向後相容,確保Arm 未來導入更多技術時仍能適用,並能獲得更多新功能。
KleidiCV 針對電腦視覺流程最佳化的解決方案,將其整合進 OpenCV 函式庫,可大幅提升效能。Arm 也與 OpenCV.ai 合作,使 Android 開發人員更容易將 OpenCV 納入專案中。