亚洲精品国产a久久久久久,亚洲 激情 ,欧美精品,亚洲av日韩综合一区在线观看,亚洲精品不卡av在线播放,无码国产69精品久久久久同性

資訊在沃

谷歌開源Gemma-3多模態(tài)大模型,性能強(qiáng)勁媲美業(yè)界頂尖

   發(fā)布時(shí)間:2025-03-13 08:13 作者:沈如風(fēng)

近期,谷歌CEO桑達(dá)爾·皮恰伊揭曉了一項(xiàng)重大技術(shù)進(jìn)展:開源多模態(tài)大模型Gemma-3。這款模型以低成本和高性能為核心賣點(diǎn),旨在為用戶提供更為高效和經(jīng)濟(jì)的AI解決方案。

Gemma-3提供了四種參數(shù)規(guī)模選擇,從10億到270億參數(shù)不等,滿足了不同用戶的需求。值得注意的是,即便是參數(shù)最多的270億版本,也僅需一張H100顯卡即可實(shí)現(xiàn)高效推理。相比之下,同類模型在達(dá)到相似效果時(shí),算力需求至少高出10倍。這一特性使得Gemma-3在性能與小參數(shù)模型領(lǐng)域脫穎而出。

在性能測(cè)試環(huán)節(jié),Gemma-3同樣表現(xiàn)不俗。根據(jù)LMSYS ChatbotArena的盲測(cè)結(jié)果,該模型僅次于DeepSeek的R1-671B,優(yōu)于OpenAI的o3-mini和Llama3-405B等業(yè)界知名模型。這一成績(jī)充分證明了Gemma-3在AI領(lǐng)域的競(jìng)爭(zhēng)力。

在架構(gòu)設(shè)計(jì)上,Gemma-3繼承了前兩代的通用解碼器Transformer架構(gòu),并在此基礎(chǔ)上進(jìn)行了多項(xiàng)創(chuàng)新和優(yōu)化。為了應(yīng)對(duì)長(zhǎng)上下文帶來的內(nèi)存占用問題,該模型采用了局部和全局自注意力層交錯(cuò)的架構(gòu)。具體而言,每5個(gè)局部層之間插入1個(gè)全局層,局部層的跨度僅為1024個(gè)token。這種設(shè)計(jì)使得全局層專注于處理長(zhǎng)上下文,而局部層則專注于處理小跨度的token,從而有效降低了內(nèi)存占用。

除了架構(gòu)上的創(chuàng)新,Gemma-3還具備強(qiáng)大的多模態(tài)能力。它能夠同時(shí)處理文本和圖像信息,并集成了定制版的SigLIP視覺編碼器。這款編碼器基于Vision Transformer架構(gòu),通過CLIP損失的變體進(jìn)行訓(xùn)練,使得Gemma-3在多模態(tài)任務(wù)中表現(xiàn)出色。

為了全面評(píng)估Gemma-3的性能,谷歌在多個(gè)主流平臺(tái)進(jìn)行了測(cè)試,包括MGSM、Global-MMLU-Lite、WMT24++、RULER和MRCR等。測(cè)試結(jié)果顯示,Gemma-3在多模態(tài)任務(wù)中取得了顯著優(yōu)于前代模型的性能。特別是在DocVQA、InfoVQA和TextVQA等任務(wù)中,其表現(xiàn)尤為突出。在長(zhǎng)文本處理方面,270億參數(shù)版本的Gemma-3在RULER128K任務(wù)上達(dá)到了66.0%的準(zhǔn)確率,進(jìn)一步證明了其強(qiáng)大的處理能力。

Gemma-3的發(fā)布標(biāo)志著谷歌在AI領(lǐng)域又邁出了堅(jiān)實(shí)的一步。這款多模態(tài)大模型不僅具備高性能和低成本的優(yōu)點(diǎn),還在架構(gòu)設(shè)計(jì)和多模態(tài)能力上進(jìn)行了多項(xiàng)創(chuàng)新。隨著技術(shù)的不斷進(jìn)步和應(yīng)用場(chǎng)景的拓展,Gemma-3有望在更多領(lǐng)域發(fā)揮重要作用。

 
 
更多>同類內(nèi)容
全站最新
熱門內(nèi)容
本欄最新