在寶可夢(mèng)游戲的世界里,一項(xiàng)新的里程碑誕生了。谷歌的Gemini 2.5 Pro大模型在直播中成功通關(guān)《寶可夢(mèng)藍(lán)》,這一成就迅速引起了廣泛關(guān)注,谷歌CEO劈柴哥興奮地在社交平臺(tái)上宣布了這一喜訊,并分享了通關(guān)時(shí)的珍貴畫面。
Gemini 2.5 Pro的這一壯舉,無疑讓眾多網(wǎng)友沸騰。大模型不僅在科技領(lǐng)域取得了突破,還在游戲世界中留下了自己的足跡。網(wǎng)友們紛紛感嘆,Gemini的自我介紹里現(xiàn)在可以自豪地加上一條:首個(gè)成為寶可夢(mèng)聯(lián)盟冠軍,并登入《寶可夢(mèng)藍(lán)》名人堂的大模型。
回顧Gemini的通關(guān)之路,可謂是一路坎坷。一年前的舊模型Claude 3.5還只能勉強(qiáng)走出新手村,到達(dá)常磐森林。而兩個(gè)月前,Claude 3.7雖然能夠擊敗道館主,但也未能成功通關(guān)。如今,Gemini 2.5 Pro終于完成了這一壯舉。
在直播中,我們可以看到Gemini每動(dòng)一步都深思熟慮。左邊的文本框里詳細(xì)展示了Gemini每個(gè)行動(dòng)背后的思考過程。在完成一長(zhǎng)串行動(dòng)后,Gemini 2.5 Pro在目標(biāo)位置足足思考了40多秒,消耗了76011個(gè)token,才規(guī)劃出下一步的行動(dòng)。這種深思熟慮的態(tài)度,雖然讓直播過程顯得有些無聊,但也展現(xiàn)了Gemini在游戲中的專注和策略。
盡管Gemini已經(jīng)成為了聯(lián)盟冠軍,但在寶可夢(mèng)這款主要面向兒童和青少年的游戲中,大模型的表現(xiàn)仍然明顯不如人類。這主要是因?yàn)榇竽P汀耙暳Σ患选?,難以解讀Game Boy屏幕中展現(xiàn)的低分辨率、像素化的世界。同時(shí),游戲中的二維地圖也對(duì)大模型構(gòu)成了挑戰(zhàn)。然而,在游戲中偏文本的部分,大模型已經(jīng)展現(xiàn)出了驚人的表現(xiàn)。例如,在寶可夢(mèng)對(duì)戰(zhàn)中,大模型能夠迅速理解游戲提示,并將這些知識(shí)整合到自己的戰(zhàn)斗策略中。
谷歌的這一突破,無疑為大模型在游戲領(lǐng)域的應(yīng)用開辟了新的道路。未來,或許會(huì)有更多的大模型加入到游戲世界中,與人類玩家一較高下。而測(cè)試大模型的基準(zhǔn),也許真的會(huì)變成誰能更快通關(guān)寶可夢(mèng)了。