AMD ROCm 登入 Windows 從筆電 PC 到工作站與雲端加速 AI 發展與開發
AMD Advancing AI 2025 大展中除了新一代 Instinct MI350 加速器、機架伺服器產品推出,AMD 也持續提供開源 AI 軟體堆疊 ROCm 7 更新,旨在滿足生成式 AI 和高效能運算工作負載日益增長的需求,同時全面顯著提升開發人員體驗。ROCm 7 具備更完善的業界標準框架支援、擴展的硬體相容性,以及全新的開發工具、驅動程式、API 和函式庫,以加速 AI 開發和部署。
ROCm 7 將在今年 Q3 支援 Windows 作業系統,展會的 AI HUB 展示區則使用 Dell Precision 7875 工作站,使用 Windows 系統展示 ComfyUI 介面與 Stable Diffusion 的節點式文字生成圖片應用。
AI 應用的結合則可利用 AI 輔助(Amuse)生成複雜紋理的影像,交由 3DS Max 軟體並即時透過 V-Ray 渲染影像。
這展示採用 Thredripper Pro 9995WX 96 核心處理器,負責 CPU 多核心渲染工作,結合 Stable Diffusion 模型、FLUX 輸出高畫質影像與 seamless 紋理。
KeyShot 也加入 AI 輔助功能,這款採用 3D 渲染與視覺化的平台,並藉助 AI 功能提供材質建議、智慧燈光優化、場景鏡頭配置建議,以及自動背景環境整合,並利用 AI 加速渲染影像的降噪處理。
ROCm 是深度環境整合的工具,Pytorch 的 Day 0 支援、Triton 效能提升、Hugging Face 的眾多模型微調支援,並提供多種主流的分佈式推論、支援多種模型,並屬於開源設計。
最新版 AMD ROCm 7,AMD 正加速 AI 改善演算法與基礎架構,讓軟體堆疊能帶來更強勁的效能與開放性。 ROCm 7 旨在滿足生成式 AI 和 HPC 工作負載日益增長的需求,同時透過可訪問性、效率和活躍的社群協作,徹底改變開發者體驗。
ROCm 7 引入了強大的分散式推理方法,充分利用了與開源生態系統(像是 SGLang、vLLM 和 llm-d 等框架)的協作。透過採用開放策略,ROCm 7 與這些合作夥伴攜手構建,共同開發共享介面和原語,以在 AMD 平台上實現高效的分散式推理。
ROCm 7 相比上一版 ROCm 6,在推論效能有著平均 3.5x 倍的提升,並在模型訓練有著 3x 倍提升。這項成就源於可用性、效能以及對 FP4 和 FP6 等低精度資料類型的支援。通訊堆疊的進一步增強優化了 GPU 利用率和資料移動。
上述展示的 AI 應用實例,ROCm 7 將 ROCm 體驗擴展到雲端之外,支援在 Ryzen 筆記型電腦和工作站上進行開發,從而實現從雲端到客戶端的持續創新。 ROCm 預計於 2025 年下半於現在主流發行版中,將 Windows 做為全面支援的作業系統,確保筆電、PC 一路至工作站、伺服器等環境中的完整開發與應用性。