NVIDIA Blackwell GPU首次實測跑分 提升高達2.2倍
NVIDIA Blackwell GPU相當強悍大家都曉得,但究竟有多強呢?
除了官方宣傳數據,現在終於首次看到了實測數據,來自MLCommons MLPerf v4.1,考核AI訓練推理表現的最佳平台。
比較對象為兩代伺服器HGX B200、HGX H200,前者包含多達八顆Blackwell GPU B200,單顆功耗高達1000W。
GPT-3預訓練項目中,Blackwell的效能相較前一代Hopper提升一倍。Llama 2 700億參數微調項目中,Blackwell的效能更是提升了高達2.2倍。
值得一提的是,Blackwell平台具備ConnectX-7 SuperNICs網路卡、Quantum-2 InfiniBand交換器,再加上第五代NVLink互連技術,可以充分保障節點間的通訊,可以平衡分配AI訓練負載,整體效率更高。
例如相同的GPT-3 1750億參數效能,Hopper需要多達256顆GPU,Blackwell僅需要64顆。
延伸影片閱讀: