近日,NVIDIA Blackwell GPU的實測數(shù)據(jù)終于浮出水面,其強悍性能引發(fā)了業(yè)界的廣泛關(guān)注。此前,這款GPU的強大能力僅限于官方宣傳,但現(xiàn)在,我們有了來自MLCommons MLPerf v4.1的權(quán)威性能測試結(jié)果,為我們揭示了Blackwell的真實實力。
在與前兩代服務(wù)器HGX B200和HGX H200的對比中,Blackwell GPU展現(xiàn)出了顯著的優(yōu)勢。尤其是在AI訓(xùn)練推理性能方面,其表現(xiàn)尤為突出。在GPT-3預(yù)訓(xùn)練項目中,相較于上一代Hopper,Blackwell的性能實現(xiàn)了翻倍的增長。
更為驚人的是,在Llama 2 700億參數(shù)微調(diào)項目中,Blackwell的性能提升了高達2.2倍。這一成就得益于其先進的硬件配備,包括ConnectX-7 SuperNICs網(wǎng)卡、Quantum-2 InfiniBand交換機,以及第五代NVLink互連總線。這些技術(shù)保障了節(jié)點間的通信效率,使得AI訓(xùn)練負載能夠得到平衡分配,進而提升了整體效率。
舉例來說,在處理GPT-3 1750億參數(shù)性能的任務(wù)時,Hopper需要多達256顆GPU,而Blackwell則僅需64顆,這一對比充分展現(xiàn)了Blackwell的高效與強大。
此次實測數(shù)據(jù)的公布,不僅印證了NVIDIA Blackwell GPU的卓越性能,更為AI領(lǐng)域的發(fā)展注入了新的活力。無疑,Blackwell將成為未來AI訓(xùn)練和推理的重要推動力。