近期,有關NVIDIA新一代RTX 50系列顯卡在性能評測中的表現(xiàn)引發(fā)了廣泛關注。在PassMark的排行榜上,RTX 5090的表現(xiàn)竟然未能超越其上代產(chǎn)品RTX 4090,這一結果令人頗感意外。
為了探究這一現(xiàn)象的根源,PassMark進行了一系列深入的調(diào)查。他們發(fā)現(xiàn),NVIDIA在最新的“Blackwell”架構中,做出了一個重大決策:不再支持32位的OpenCL和CUDA。這一變化導致了RTX 50系列顯卡與現(xiàn)有的許多測試工具和應用程序之間存在嚴重的兼容性問題。
在PassMark的測試過程中,當運行DirectCompute基準測試時,RTX 50系列顯卡返回了一個錯誤代碼:“CL_OUT_OF_RESOURCES (-5)”。這一錯誤表明,顯卡在處理某些任務時,資源分配出現(xiàn)了問題。
經(jīng)過進一步的分析,開發(fā)人員發(fā)現(xiàn),盡管測試的主要應用程序已經(jīng)多年采用64位架構,但其中部分計算子測試仍然使用了32位的代碼。這些32位代碼在RTX 4000系列及更早的顯卡上能夠正常運行,但在RTX 50系列上卻無法直接執(zhí)行。
具體來說,RTX 50系列GPU不再支持32位CUDA應用程序的直接運行,這些應用程序需要依賴CPU來處理,從而導致性能大幅下降。這一變化不僅影響了測試結果的準確性,還可能對用戶的實際使用體驗造成負面影響。
面對這一問題,PassMark正在積極應對。他們正在將受影響的OpenCL代碼移植到64位架構上,以便能夠正確測試新顯卡的性能。然而,PassMark也坦言,許多包含32位OpenCL組件的應用程序,如果不進行源代碼的修改,可能永遠無法在RTX 50系列上正常運行。
PassMark還指出,RTX 50系列顯卡在Direct X9性能上的不佳表現(xiàn),可能并不完全是由于32位OpenCL和CUDA支持被移除所導致的。他們推測,可能還有其他架構上的變化影響了舊版渲染路徑的性能。