在科技界的矚目之下,谷歌于5月21日凌晨舉辦了I/O 2025開(kāi)發(fā)者大會(huì),這場(chǎng)盛會(huì)不僅聚焦于前沿的AI技術(shù),還揭示了安卓XR平臺(tái)和安卓16的最新規(guī)劃及特色功能。
谷歌首席執(zhí)行官Sundar Pichai在大會(huì)上透露,自去年以來(lái),谷歌AI大模型和API的處理能力實(shí)現(xiàn)了巨大飛躍,從每月處理9.7萬(wàn)億個(gè)Token增長(zhǎng)到480萬(wàn)億個(gè)。同時(shí),谷歌搜索業(yè)務(wù)中的AI綜述功能已吸引了15億月活躍用戶,彰顯了AI技術(shù)的廣泛影響力。
AI正逐步滲透至我們生活的方方面面,成為不可或缺的元素。無(wú)論是谷歌推出的新一代AI大模型、AI應(yīng)用,還是XR平臺(tái)和手機(jī)系統(tǒng),都與AI技術(shù)緊密相連。
在本次大會(huì)中,AI無(wú)疑是主角,發(fā)布的新品數(shù)量最多。備受期待的Gemini 2.5系列終于確定將于6月正式上線,其中Gemini 2.5 Pro被譽(yù)為全球最智能的AI模型,在LMArena的ELO基準(zhǔn)測(cè)試中取得了1448分的高分。Gemini 2.5 Pro還推出了深度思考版本,在多項(xiàng)測(cè)試中表現(xiàn)優(yōu)于基礎(chǔ)版。而Gemini 2.5 Flash作為輕量級(jí)模型,效率提升了22%,Token使用量減少了20%至30%,資源消耗更低。
Gemini 2.5系列還新增了文本轉(zhuǎn)語(yǔ)音功能,細(xì)節(jié)表現(xiàn)豐富,甚至能模擬竊竊私語(yǔ),非常適合個(gè)人創(chuàng)作者為影視作品配音。谷歌還推出了文本擴(kuò)散模型Gemini Diffusion,該模型采用逐步優(yōu)化噪聲生成內(nèi)容的方式,在編程和數(shù)學(xué)領(lǐng)域展現(xiàn)出卓越性能。
基于Gemini 2.5系列的能力,谷歌的Project Mariner項(xiàng)目也有望加速落地。該項(xiàng)目此前代號(hào)為Jarvis,是一個(gè)能夠操作瀏覽器和其他軟件的AI智能體,能同時(shí)監(jiān)督多達(dá)10個(gè)任務(wù),并通過(guò)用戶展示的任務(wù)操作進(jìn)行學(xué)習(xí)。
谷歌將包括Gemini 2.5系列在內(nèi)的強(qiáng)大AI功能整合到谷歌搜索中,通過(guò)AI搜索提供圖表生成、票務(wù)查找以及視頻、地圖等信息,使搜索結(jié)果更加豐富多樣,相較于傳統(tǒng)搜索模式具有更大優(yōu)勢(shì)。
谷歌還展示了智能購(gòu)物功能,用戶只需上傳個(gè)人照片,AI就能將商店里的衣服自動(dòng)“穿戴”到照片中的人物身上,幫助用戶更直觀地判斷衣服是否合身。
除了多模態(tài)大模型Gemini 2.5系列,谷歌還發(fā)布了文生圖模型Imagen 4和視頻生成模型Veo 3。Imagen 4生成圖片的速度比上一代快3到10倍,細(xì)節(jié)更加豐富,能生成復(fù)雜物體如織物、水滴、動(dòng)物毛發(fā)等,分辨率高達(dá)2K,還能制作賀卡、海報(bào)、漫畫等。Veo 3則大幅提升了生成畫面的質(zhì)量,首次支持生成帶有音頻的視頻,效果驚人。
谷歌專為內(nèi)容創(chuàng)作者打造的AI電影創(chuàng)作應(yīng)用Flow,集合了Veo、Imagen和Gemini模型的能力。據(jù)谷歌介紹,F(xiàn)low可以通過(guò)輸入文字或?qū)胨夭膭?chuàng)作視頻,并通過(guò)Gemini對(duì)自然語(yǔ)言的理解微調(diào)視頻,將電影創(chuàng)作從專業(yè)領(lǐng)域推向大眾。未來(lái),隨著Flow能力的不斷增強(qiáng),或許將顛覆傳統(tǒng)的影視劇制作模式。
在XR領(lǐng)域,谷歌與三星聯(lián)手開(kāi)發(fā)的安卓XR平臺(tái)自去年公布以來(lái),已獲得數(shù)百家軟件開(kāi)發(fā)商的支持。大會(huì)上,基于該平臺(tái)的首款XR設(shè)備——三星Project Moohan亮相,該產(chǎn)品搭載驍龍XR2 Plus Gen 2芯片,無(wú)需連接PC或其他設(shè)備,能夠獨(dú)立運(yùn)行,預(yù)計(jì)將于今年晚些時(shí)候發(fā)售。同時(shí),中國(guó)企業(yè)Xreal開(kāi)發(fā)的Project Aura也亮相大會(huì),這是首款基于安卓XR平臺(tái)的AR眼鏡,支持光學(xué)透視和虛擬透視的沉浸式體驗(yàn)。
谷歌表示,與AI深度融合的安卓XR平臺(tái)支持第一人稱視角智能輔助和無(wú)接觸輔助功能,用戶可以通過(guò)自然語(yǔ)言與設(shè)備交互,完成信息查詢、日程管理、實(shí)時(shí)導(dǎo)航等操作。安卓XR平臺(tái)有望統(tǒng)一非蘋果XR設(shè)備的系統(tǒng)生態(tài),降低軟件開(kāi)發(fā)成本,激發(fā)開(kāi)發(fā)者積極性。
谷歌還公布了Wear OS 6和安卓16的部分功能和特性。Wear OS 6融合了Material 3 Expressive設(shè)計(jì)語(yǔ)言,更適合圓形屏幕,并引入了動(dòng)態(tài)色彩主題。而安卓16則主要圍繞Live Updates功能,該功能與蘋果的Live Activities相似,可以顯示導(dǎo)航、外賣配送、網(wǎng)約車狀態(tài)等信息。
谷歌在大會(huì)上還推出了為安卓手機(jī)打造的全能AI助手Project Astra,能夠根據(jù)使用場(chǎng)景和用戶要求主動(dòng)制定解決方案并采取行動(dòng)。這一功能可能基于多模態(tài)Gemini Nano模型的視覺(jué)識(shí)別能力,具有普適性,無(wú)需與應(yīng)用一對(duì)一適配。
隨著AI和XR技術(shù)的不斷成熟,產(chǎn)品更加注重實(shí)用性。谷歌發(fā)布的眾多AI大模型,如端側(cè)多模態(tài)模型Gemma 3n和基于Gemma 3架構(gòu)的開(kāi)源醫(yī)療模型MedGemma,都與搜索引擎、安卓XR、安卓16深度融合,致力于提升用戶體驗(yàn)。