在科技界的矚目之下,谷歌于2025年I/O開發(fā)者大會(huì)上震撼發(fā)布了其最新研發(fā)成果——Gemma 3n,一款專為內(nèi)存有限設(shè)備量身打造的端側(cè)多模態(tài)AI模型。這款模型不僅能夠處理包括音頻、文本、圖片和視頻在內(nèi)的多種數(shù)據(jù)類型,而且其運(yùn)行需求之低,僅需2GB內(nèi)存便能在智能手機(jī)和平板電腦上流暢運(yùn)行。
Gemma 3n的核心優(yōu)勢(shì)源自其基于Gemini Nano架構(gòu)的設(shè)計(jì),并融入了谷歌DeepMind團(tuán)隊(duì)研發(fā)的Per-Layer Embeddings(PLE)技術(shù)。這項(xiàng)技術(shù)的一大突破在于,盡管Gemma 3n的參數(shù)量分別達(dá)到了50億和80億,但其內(nèi)存占用卻能夠媲美20億和40億參數(shù)的模型,極大地拓寬了其在低內(nèi)存設(shè)備上的應(yīng)用前景。據(jù)Gemma 3n的產(chǎn)品經(jīng)理Gus Martins介紹,這一創(chuàng)新為設(shè)備端AI應(yīng)用帶來(lái)了前所未有的表現(xiàn)力。
除了PLE技術(shù),Gemma 3n還集成了KVC共享和高級(jí)激活量化等先進(jìn)技術(shù),這些技術(shù)的融合使得模型在移動(dòng)設(shè)備上的運(yùn)行效率得到了顯著提升,響應(yīng)速度提高了1.5倍,同時(shí)保持了比Gemma 3 40億參數(shù)版本更高的質(zhì)量水平。這一性能優(yōu)化無(wú)疑為移動(dòng)設(shè)備的AI應(yīng)用注入了新的活力。
值得注意的是,Gemma 3n在非英語(yǔ)語(yǔ)言的處理能力上也取得了顯著進(jìn)步,特別是在日語(yǔ)、德語(yǔ)、韓語(yǔ)、西班牙語(yǔ)和法語(yǔ)等語(yǔ)言上展現(xiàn)出了卓越的性能。在WMT24多語(yǔ)言基準(zhǔn)測(cè)試中,該模型以50.1%的高分,充分證明了其強(qiáng)大的多語(yǔ)言處理能力,為全球范圍內(nèi)的用戶帶來(lái)了更加便捷和精準(zhǔn)的AI體驗(yàn)。
對(duì)于普通用戶而言,無(wú)需進(jìn)行任何復(fù)雜設(shè)置,即可通過Google AI Studio在瀏覽器中輕松使用Gemma 3n。而對(duì)于開發(fā)者來(lái)說(shuō),他們則可以利用Google AI Edge將Gemma 3n的本地功能無(wú)縫集成到自己的應(yīng)用中,從而為用戶提供更加豐富的文本和圖像理解與生成功能。這一舉措無(wú)疑為開發(fā)者提供了更加強(qiáng)大的工具,也為AI技術(shù)的廣泛應(yīng)用開辟了新的道路。