(資料圖)
IT之家 11 月 13 日消息,科技媒體 Wccftech 昨日(11 月 12 日)發布博文,報道稱在 MLPerf AI 訓練基準測試中,英偉達基于 Blackwell Ultra 架構的 GB300 NVL72 平臺包攬了全部 7 個項目的冠軍,取得了壓倒性勝利。
IT之家援引博文介紹,本次測試中最亮眼的成績是,GB300 NVL72 平臺僅用時 10 分鐘,便完成訓練擁有 4050 億參數的 Llama 3.1 大模型。
此外,在其他關鍵測試中也表現出色,例如僅需 0.4 分鐘即可完成 Llama 2 70B 模型的 LoRA 微調,訓練 Llama 3.1 8B 模型也只需 5.2 分鐘。
與上一代產品相比,Blackwell Ultra 的性能實現了巨大飛躍。測試結果顯示,在 Llama 2 70B 微調任務中,8 塊 GB300 GPU 提供的性能是同等數量 H100 GPU 的 5 倍。
而在 Llama 3.1 405B 預訓練任務中,GB300 的性能也達到了 H100 的 4 倍以上,并且比同為 Blackwell 架構的 GB200 快了近 2 倍。
該媒體指出這一性能突破的背后,是軟硬件協同創新的結果。硬件方面,GB300 NVL72 系統集成了速率高達 800 GB/s 的 Quantum-X800 InfiniBand 高速網絡,并為每塊 GPU 配備了 279GB 的 HBM3e 高帶寬內存,整個系統的總內存容量(GPU+CPU)更是達到了驚人的 40TB。
在軟件層面,FP4 精度的全面采用是關鍵。英偉達通過在模型訓練的每一層都應用 FP4 精度,將計算速度提升至 FP8 的兩倍,而 Blackwell Ultra 架構則將這一優勢進一步放大至 3 倍。
營業執照公示信息