AMD公司在“Advancing AI”大會(huì)上宣布推出全新的Instinct MI325X加速卡,該加速卡基于CDNA 3架構(gòu),相較于舊款MI300X進(jìn)行了多項(xiàng)升級(jí)。為了應(yīng)對(duì)日益增長(zhǎng)的AI模型計(jì)算需求,MI325X特別強(qiáng)化了HBM3E內(nèi)存和計(jì)算能力。
MI325X加速卡配備了高達(dá)256 GB的HBM3E內(nèi)存,相較于MI300的192GB提升了1.8倍,同時(shí)內(nèi)存帶寬也達(dá)到了6 TB/s。在計(jì)算能力方面,MI325X在FP16下提供1.3 PetaFLOPS,在FP8訓(xùn)練和推理下提供2.6 PetaFLOPS,較MI300提升1.3倍。
加速器的核心在于ROCm軟件堆棧,AMD計(jì)劃將ROCm引入每一款GPU,并與開(kāi)源社區(qū)合作,整合PyTorch、Triton、ONNX等框架的功能。
AMD還透露了對(duì)于未來(lái)的規(guī)劃,預(yù)計(jì)將在2025年下半年推出基于TSMC 3納米工藝的CDNA 4 Instinct MI355X加速器,配備288 GB的HBM3E內(nèi)存。