谷歌近日宣布,其第六代TPU Trillium已正式向Google Cloud的客戶開放。這一舉措旨在借助Trillium強大的計算能力、卓越的性能以及可持續(xù)性,進一步推動AI模型的發(fā)展。
作為Google Cloud AI超級計算機的核心組件,Trillium TPU代表了一種革命性的超級計算機架構。它融合了性能優(yōu)化的硬件、開放的軟件環(huán)境、前沿的機器學習框架以及靈活的消費模型,共同構成了一個高度集成的系統(tǒng)。
早在今年5月的I/O開發(fā)者大會上,谷歌便已經宣布了Trillium TPU。據(jù)官方介紹,與上一代相比,Trillium TPU在訓練性能上實現(xiàn)了4倍以上的提升,推理吞吐量提升高達3倍,峰值計算性能更是提升了4.7倍。
在效率方面,Trillium TPU同樣表現(xiàn)出色。其能源效率提高了67%,每美元訓練性能提升高達2.5倍,推理性能也有1.4倍的提升。這一顯著的效率提升,無疑將為用戶帶來更加經濟實惠且高效的AI計算體驗。
在規(guī)模擴展方面,Trillium TPU同樣具備強大的能力。單個Jupiter網(wǎng)絡結構可容納多達10萬個Trillium芯片,同時配備了雙倍的HBM容量和ICI帶寬,支持大規(guī)模AI訓練。谷歌官方表示,Trillium的近乎線性擴展能力,配合高速芯片互連和Jupiter數(shù)據(jù)中心網(wǎng)絡,可以顯著加快大型模型的訓練速度。
舉例來說,在訓練gpt3-175b模型時,即使跨數(shù)據(jù)中心網(wǎng)絡運行,24個Pod(共6144個芯片)也能達到94%的擴展效率。這一成績充分展示了Trillium TPU在大型模型訓練方面的卓越表現(xiàn)。
Trillium TPU還具備出色的靈活性和可擴展性。用戶可以根據(jù)實際需求,靈活調整計算資源和配置,以滿足不同規(guī)模和復雜度的AI計算任務。這一特點使得Trillium TPU成為眾多企業(yè)和研究機構在AI領域的首選計算平臺。
隨著谷歌正式向Google Cloud客戶開放第六代TPU Trillium,我們有理由相信,這一先進的計算平臺將在未來為AI領域的發(fā)展注入更加強勁的動力。