是德科技推出 AI 架構解決方案驗證工作負載、互連及網路等以提升 AI 資料中心的可擴展性
為了提升資料中心的 AI 處理能力,是德科技推出 AI 架構解決方案,並推出 KAI 資料中心建構工具、互連及網路效能測試儀以及 DCA-M 取樣示波器,提升資料中心的可擴展性。
隨著全球進入 AI 浪潮之下,支援各種 AI 應用的後端資料中心,以及內部的伺服器、GPU 以及內部連接與高速網路需求提升以即時應付更多的資料。根據調查指出,目前許多 GPU 的算力並未全部發揮,使用率大都不到六成,許多時間都在等待資料。另外也有調查指出,有許多模型訓練失敗的原因,主要在於資料傳輸出問題,因此如何讓 GPU 可發揮算力以及更佳的資料傳輸架構,並因應新一代高速傳輸標準,成為現代 AI 資料中心的挑戰。
是德科技資深區域經理王欽洲(左)與行銷處副總經理羅大鈞(右)
為了驗證 AI 資料中心各種元件,是德科技(Keysight Technologies)宣布推出 KAI (Keysight Artificial Intelligence) 架構端到端解決方案組合,透過模擬真實工作負載來驗證AI叢集元件,以協助客戶擴展資料中心的AI 處理能力。是德科技同時還推出三款全新產品:KAI 資料中心建構工具(Data Center Builder)、互連與網路效能測試儀和 DCA-M 取樣示波器,以大幅加速 AI 網路設計和部署,並支援 1.6T 元件的特性分析和測試,確保資料中心網路穩定運作並達到效能最佳化。
網路等通訊開題常讓 GPU 處於等待狀態,也會導致模型訓練失敗
擴展 AI 資料中心需要在設計和建置過程中全面在元件與系統層測試與驗證每個晶片、電纜、互連、交換器、伺服器和 GPU,運用全堆疊的工作負載模擬與實體層測試,以找到單獨元件測試時無法發現的問題,並可更快地發揮 AI 最高性能、擴充產能,以回收龐大的投資。
KAI 架構可協助 AI 供應商、半導體製造商和網路設備製造商加速設計與開發,尤其面對新一代的 PCIe、記憶體以及 CXL 等高速標準,並能驗證高速互連、電纜和晶片組等元件的相容性。此外透過端到端模擬驗證和調整資料中心的系統層級效能,並在正式部署前找出效能瓶頸,降低工作負載失敗的風險,加速資料中心的部署與營運。
KAI 資料中心建構工具具有真實工作負載模擬功能,並可找出網路瓶頸與測試模型以最佳化系統效能
是德科技同時還推出 KAI 資料中心建構工具、互連與網路效能測試儀與 DCA-M 取樣示波器三款新產品以因應 AI 產業的挑戰。是德科技 AI 資料中心建構工具有工作負載模擬功能,可將大型語言模型(LLM)和其他 AI 模型訓練工作負載,整合至 AI 基礎設施元件(如網路、主機與加速器)的設計和驗證流程中。而且還能重現真實AI訓練任務中的網路通訊,以加速實驗流程、縮短技術熟練的學習曲線,並深入找出效能下降的潛在原因。此解決方案實現硬體設計、協定、架構和 AI 訓練演算法之間更緊密的協同效應以提升系統效能。
DCA-M 取樣示波器(左)與互聯與網路效能測試儀 1600GE(中)
過去檢驗網路互連效能因自動化有限,甚至需要手動操作及進階技能撰寫腳本,更耗用大量時間。而且測試流程還缺乏統一的系統來組織和儲存互連資料和報告,不容易追蹤、複製測試和配置。在 AI 和資料中心互連的多樣性及規模不斷擴大下,傳統的測試方法已無法準確預測和衡量複雜網路的可靠性。是德科技新推出的互聯與網路效能測試儀 1600GE 採用 ITS 軟體,提供可智慧化地組織、儲存和使用資料的整體系統,以自動驗證高速乙太網和 AI 資料中心的互連。
隨著 AI 資料中心網路中快速部署 1.6T 光學互連技術下,測試極高的資料傳輸速率和嚴格的信號完整性成為極大的挑戰,工程師需在各種嚴峻的作業條件下檢驗收發器效能,採用的測試設備頻寬、低雜訊和靈敏度要求更高。在製造階段,自動化測試必須具備高效率、可擴展性與精確性,才能在高輸送量和高產能下驗證關鍵參數,確保效能符合資料中心的要求並符合產業標準規範。
新推出的 DCA-M 取樣示波器是專為 1.6T 收發器嚴苛測試需求設計,可支援次世代資料中心 AI 叢集之光學互連技術的研發與製造。DCA-M 取樣示波器具備業界最高的光學量測靈敏度,每通道可支援高達 240Gbps 的高速光信號分析,並內建高達 120 GBaud 的時脈回復。