近日,中國(guó)信息通信研究院在百度AI Day活動(dòng)中揭曉了大模型推理能力的評(píng)估結(jié)果,引發(fā)業(yè)界廣泛關(guān)注。
在此次評(píng)估中,百度推出的文心大模型X1 Turbo表現(xiàn)尤為突出,在涵蓋24項(xiàng)能力的嚴(yán)格測(cè)試中,有16項(xiàng)獲得了滿分5分,綜合評(píng)級(jí)更是達(dá)到了當(dāng)前的最高級(jí)別“4+級(jí)”。這也意味著,X1 Turbo成為了國(guó)內(nèi)首個(gè)通過(guò)這一高規(guī)格測(cè)評(píng)的大模型。
具體來(lái)看,X1 Turbo在邏輯推理、代碼推理以及推理效果優(yōu)化等技術(shù)維度上均展現(xiàn)出了卓越的實(shí)力,同時(shí),在工具支持度、安全可靠度等應(yīng)用層面也同樣獲得了滿分評(píng)價(jià)。這些成績(jī)的取得,無(wú)疑是對(duì)百度在AI技術(shù)研發(fā)和應(yīng)用領(lǐng)域深厚實(shí)力的有力證明。
在AI Day的活動(dòng)現(xiàn)場(chǎng),百度技術(shù)專家吳甜詳細(xì)闡述了文心大模型最新版本的技術(shù)創(chuàng)新點(diǎn)。她提到,文心大模型4.5作為多模態(tài)基礎(chǔ)大模型,為文心4.5 Turbo的誕生奠定了堅(jiān)實(shí)的基礎(chǔ)。而文心4.5 Turbo在繼承4.5版本優(yōu)勢(shì)的基礎(chǔ)上,進(jìn)一步提升了效果并降低了成本。
基于文心4.5 Turbo的升級(jí),文心X1也迎來(lái)了X1 Turbo版本。這一新版本不僅在性能上有了顯著提升,更配備了更為先進(jìn)的思維鏈技術(shù)。這使得X1 Turbo在問(wèn)答、創(chuàng)作、邏輯推理、工具調(diào)用以及多模態(tài)能力等方面均實(shí)現(xiàn)了進(jìn)一步的增強(qiáng)。
吳甜的講解不僅讓現(xiàn)場(chǎng)觀眾對(duì)文心大模型的最新進(jìn)展有了更為深入的了解,同時(shí)也向業(yè)界展示了百度在AI技術(shù)研發(fā)和應(yīng)用方面的持續(xù)創(chuàng)新能力。