NVIDIA 為 Meta 打造大型人工智慧研究超級電腦
Meta 宣布其人工智慧(AI)研究超級電腦 RSC 搭載 NVIDIA DGX A100、網路及 AI 軟體,能提供 Meta AI 研究 5 exaflops 的運算能力,以及由 NVIDIA 系統、InfiniBand fabric 及 AI 軟體針對跨數千個 GPU 進行最佳化。
Meta 希望藉由 RSC 來訓練超過一萬億個參數的 AI 模型,而 RSC 採用 760 個 NVIDIA DGX A100 系統運算節點,這組合著總共 6,080 個 NVIDIA A100 GPU,並通過 NVIDIA Quantum 每秒 200Gb 連接速度的 InfiniBand 相連,能夠提供每秒 1,896 次浮點運算 (petaFLOPS) 的 TF32 效能。
而 Meta 在 2017 年就已經採用 22,000 個 NVIDIA V100 Tensor Core GPU 進行每日 35,000 個 AI 訓練工作,至於 RSC 的早期效能測試顯示,對比舊系統效能在訓練大型 NLP 模型可達到 3x 倍速度提升,以及 20x 倍的電腦視覺效能增長。
RSC 該系統於今年稍晚全面部署後,有望成為迄今完成設置的最大 NVIDIA DGX A100 系統。
source: blogs.nvidia.com
延伸影片閱讀: