大阪都會大學(xué)醫(yī)學(xué)研究生院近期公布了一項引人矚目的研究成果,該研究發(fā)現(xiàn),生成式人工智能(AI)在醫(yī)療診斷領(lǐng)域的準確率已接近非專家醫(yī)生的水平,這一發(fā)現(xiàn)為AI在醫(yī)療領(lǐng)域的應(yīng)用開辟了新的可能性。
這項研究通過系統(tǒng)性回顧和薈萃分析,評估了包括GPT-4、Llama3 70B、Gemini 1.5 Pro和Claude 3 Sonnet在內(nèi)的多個主流AI模型。其中,GPT-4因其廣泛的應(yīng)用性而成為了研究的重點。結(jié)果顯示,這些AI模型的平均診斷準確率為52.1%,這一成績與非專家醫(yī)生的平均水平不相上下,但與專家醫(yī)生相比,仍有15.8%的差距。
值得注意的是,在皮膚科診斷方面,AI的表現(xiàn)尤為亮眼。研究人員認為,這得益于AI在圖像模式識別方面的強大能力。然而,他們也指出,皮膚科的診斷并不僅僅依賴于圖像識別,還需要結(jié)合臨床推理和個性化決策。因此,盡管AI在皮膚科領(lǐng)域取得了顯著成果,但其實際應(yīng)用價值仍需進一步審慎評估。
總體而言,大阪都會大學(xué)的研究表明,生成式AI已具備輔助醫(yī)療診斷的潛力。特別是在醫(yī)學(xué)教育培訓(xùn)、支持非專家醫(yī)生診療以及在醫(yī)療資源匱乏地區(qū)提供診斷支持方面,AI的應(yīng)用前景廣闊。隨著技術(shù)的不斷發(fā)展,未來AI與專家醫(yī)生之間的診斷差距有望進一步縮小,為醫(yī)療領(lǐng)域帶來更多的創(chuàng)新和變革。