記者 孟梅 付文超
“文心一言的用戶規(guī)模達(dá)到4.3億?!?1月12日,以“應(yīng)用來了”為主題的百度世界2024在上海舉辦,百度首席技術(shù)官王海峰在會上宣布了這一數(shù)據(jù)。除用戶規(guī)模外,王海峰還解讀了文心大模型最新技術(shù)及應(yīng)用,如檢索增強的文生圖、無代碼產(chǎn)品秒噠、文心快碼等。
大會現(xiàn)場,繼百度創(chuàng)始人李彥宏宣布文心大模型日均調(diào)用量已超過15億,王海峰公布了文心一言用戶規(guī)模達(dá)到4.3億。自去年3月16日發(fā)布文心一言以來,百度文心大模型不斷升級,知識增強、檢索增強以及智能體等技術(shù)也在不斷進化。
據(jù)王海峰介紹,在檢索增強方面,百度研發(fā)了“理解-檢索-生成”協(xié)同優(yōu)化的檢索增強技術(shù),提升了大模型技術(shù)及應(yīng)用效果;面向不同應(yīng)用場景的生圖需求,進一步研發(fā)了檢索增強的文生圖技術(shù),既可以生成精確的圖片,也可以進行泛化生圖。
那么,大模型是如何做到這一點的呢?
首先,基于大模型對用戶的需求進行分析理解,自動規(guī)劃精確或泛化方案,比如對哪些實體進行增強;接著在增強階段,對需要增強的實體,檢索并選擇相應(yīng)的參考圖。最后在生成階段,自研了多??煽厣鷪D大模型,一方面,通過局部注意力計算,在保持實體特征不變的情況下,實現(xiàn)了圖像的高泛化生成,比如根據(jù)牛頓的肖像,生成繪本風(fēng)格的牛頓;另一方面,通過整體注意力計算,進行高精確的圖像生成,比如生成圖中的汽車跟原圖片保持完全一致。
同時,王海峰分享了多智能體在代碼場景里的應(yīng)用——秒噠和文心快碼。秒噠采用了智能體的中心化模式,其中的代碼智能體通過場景知識的增強,提升了復(fù)雜代碼生成的質(zhì)量與穩(wěn)定性,高效實現(xiàn)用戶需要的功能。智能代碼助手文心快碼升級至3.0版本,現(xiàn)場王海峰進一步演示了文心快碼完成系統(tǒng)的功能開發(fā)、代碼測試和問題修復(fù)等能力。在開發(fā)全流程中,多個智能體流水線協(xié)同,大幅提升了程序員的工作質(zhì)量和效率。
大模型、智能體等技術(shù)發(fā)展迅速,而這些技術(shù)如何更高效率、更低門檻應(yīng)用于產(chǎn)業(yè)呢?
據(jù)了解,面向產(chǎn)業(yè)需求,百度打造了文心大模型矩陣,包括ERNIE 4.0 Turbo等旗艦大模型、ERNIE Speed等輕量模型,以及基于基礎(chǔ)模型生產(chǎn)的系列思考模型和場景模型,滿足不同應(yīng)用的需要。而在這背后,文心大模型和飛槳深度學(xué)習(xí)聯(lián)合優(yōu)化,持續(xù)創(chuàng)新,提升了模型效果、訓(xùn)練效率和推理性能,支撐了文心大模型的廣泛應(yīng)用。王海峰現(xiàn)場披露,飛槳文心開發(fā)者數(shù)量已達(dá)1808萬,服務(wù)了43萬家企業(yè),創(chuàng)建了101萬個模型。