在備受矚目的Google I/O 2025開發(fā)者大會(huì)上,谷歌揭曉了其Gemini 2.5系列大型語言模型的最新突破。此次發(fā)布的系列包含兩款核心模型:輕量級(jí)卻功能強(qiáng)大的Gemini 2.5 Flash,以及性能更為卓越的Gemini 2.5 Pro。據(jù)谷歌透露,Gemini 2.5 Flash預(yù)計(jì)將于六月上旬面世,而Gemini 2.5 Pro則將在稍后時(shí)間推出。
Gemini 2.5 Flash在多個(gè)維度上實(shí)現(xiàn)了對(duì)其前代產(chǎn)品的超越。該模型引入了創(chuàng)新的文本轉(zhuǎn)語音功能,能生成極為自然的聲音效果,甚至能模擬出耳語的細(xì)膩質(zhì)感。更令人稱奇的是,它能在不同語言間無縫切換,且保持聲音的一致性。Gemini 2.5 Flash還具備在多種語言環(huán)境下靈活應(yīng)用的能力。
谷歌方面著重強(qiáng)調(diào),Gemini 2.5 Flash在安全性方面達(dá)到了前所未有的高度,同時(shí)在效率上較上一代提升了22%,能耗也顯著降低。這款輕量級(jí)模型還新增了“展示思考流程”的功能,使用戶能夠直觀看到模型如何解答問題和處理查詢,極大地增強(qiáng)了透明度。
與此同時(shí),谷歌還預(yù)告了功能更為強(qiáng)大的Gemini 2.5 Pro。據(jù)DeepMind的Demis Hassabis介紹,Gemini 2.5 Pro堪稱全球最智能的AI模型之一,它不僅能夠模擬整個(gè)城市的運(yùn)作,還在學(xué)習(xí)領(lǐng)域處于領(lǐng)先地位。該模型將引入全新的增強(qiáng)推理模式——“Deep Think”,旨在應(yīng)對(duì)更為復(fù)雜的任務(wù)挑戰(zhàn)。然而,谷歌表示,為了確保模型的穩(wěn)定性和可靠性,Gemini 2.5 Pro將在進(jìn)行額外的安全測試后再向公眾發(fā)布。
Gemini 2.5 Flash的一大特色在于其混合推理模式。用戶可以根據(jù)實(shí)際需求開啟或關(guān)閉推理功能,并通過設(shè)置“思考預(yù)算”來靈活調(diào)整推理的深度。這一模式使得用戶能夠在性能、成本和延遲之間找到最佳的平衡點(diǎn)。例如,在處理簡單任務(wù)時(shí),可以選擇低預(yù)算以保持低延遲和低成本;而在面對(duì)復(fù)雜任務(wù)時(shí),則可以選擇高預(yù)算以獲得更準(zhǔn)確、全面的答案。
Gemini 2.5 Flash還具備動(dòng)態(tài)推理資源管理能力。它能根據(jù)任務(wù)的復(fù)雜度自動(dòng)調(diào)整資源分配,實(shí)現(xiàn)高效的計(jì)算。在多項(xiàng)基準(zhǔn)測試中,如ME 2025和多模態(tài)推理(MMMU),Gemini 2.5 Flash均展現(xiàn)出了卓越的性能,與OpenAI的o4-mini不相伯仲,充分證明了其強(qiáng)大的實(shí)力。