亚洲精品国产a久久久久久,亚洲 激情 ,欧美精品,亚洲av日韩综合一区在线观看,亚洲精品不卡av在线播放,无码国产69精品久久久久同性

資訊在沃

AMD GPU大飛躍!Stable Diffusion模型性能提升最高達(dá)3.8倍

   發(fā)布時(shí)間:2025-04-18 14:31 作者:唐云澤

近期,NVIDIA在人工智能領(lǐng)域的領(lǐng)先地位不僅得益于其強(qiáng)大的硬件性能,還歸功于其生態(tài)系統(tǒng)的高度優(yōu)化,使得AI應(yīng)用能夠發(fā)揮最佳效能。相比之下,AMD雖然在這一領(lǐng)域起步稍慢,但正奮力追趕,不斷縮小與NVIDIA的差距。

值得注意的是,Stability AI近期發(fā)布了一項(xiàng)針對(duì)ONNX框架優(yōu)化的Stable Diffusion模型,該模型在AMD Radeon顯卡及銳龍集成顯卡上的運(yùn)行效率顯著提升,最高可達(dá)3.8倍。這一突破無疑為AMD硬件在AI應(yīng)用上的表現(xiàn)注入了新的活力。

AMD方面表示,過去一年中,他們積極與操作系統(tǒng)供應(yīng)商(OSV)、原始設(shè)備制造商(OEM)以及獨(dú)立軟件供應(yīng)商(ISV)合作,對(duì)AMD硬件上的AI應(yīng)用進(jìn)行全面優(yōu)化,涵蓋硬件設(shè)計(jì)、驅(qū)動(dòng)程序、編譯器以及機(jī)器學(xué)習(xí)模型等多個(gè)層面。這一努力如今已初見成效。

據(jù)AMD官方公布的數(shù)據(jù)顯示,經(jīng)過優(yōu)化后的SDXL 1.0和SDXL Turbo在AMD硬件上的推理性能相較于基礎(chǔ)的PyTorch模型有了顯著提升,最高可達(dá)3.8倍。而SD3.5模型則能提升最多2.6倍的性能。在實(shí)際的圖片和視頻生成應(yīng)用中,這些優(yōu)化帶來的性能提升同樣顯著。例如,在RX 9070 XT顯卡上,SDXL 1.0、SDXL Turbo、SD3.5 Large以及SD3.5 Large Turbo的效率分別提升了3.1倍、1.5倍、3.3倍和2.1倍。

在銳龍AI MAX+ 395處理器上,SDXL 1.0、SD3.5 Large以及SD3.5 Large Turbo的效率也分別提升了1.4倍、3.3倍和3.0倍。這些數(shù)據(jù)充分證明了AMD在AI硬件優(yōu)化方面所取得的顯著進(jìn)展。

AMD硬件優(yōu)化版的Stable Diffusion模型具有一個(gè)特殊的“_amdgpu”后綴標(biāo)記,方便用戶進(jìn)行識(shí)別。目前,這些優(yōu)化后的模型已經(jīng)可以在Stability AI或Hugging Face等平臺(tái)上下載使用。同時(shí),AMD還與TensorStack AI聯(lián)合推出了最新版的Amuse 3.0軟件,進(jìn)一步提升了AMD硬件在AI應(yīng)用中的表現(xiàn)。

為了確保用戶能夠充分利用這些優(yōu)化帶來的性能提升,AMD還提醒用戶注意GPU驅(qū)動(dòng)版本的選擇。建議使用不低于24.30.31.05預(yù)覽版的AMD GPU驅(qū)動(dòng),或者等待即將發(fā)布的25.4.1正式版驅(qū)動(dòng)。這些更新將確保用戶的AMD硬件能夠充分發(fā)揮其在AI應(yīng)用中的潛力。

 
 
更多>同類內(nèi)容
全站最新
熱門內(nèi)容
本欄最新