在AI技術(shù)日新月異的當(dāng)下,視頻大模型領(lǐng)域迎來(lái)了前所未有的發(fā)展浪潮。繼OpenAI發(fā)布其視頻大模型Sora Turbo之后,盡管其支持的生成視頻時(shí)長(zhǎng)僅為最初宣傳的三分之一,且仍處于小范圍測(cè)試階段,但這并未阻擋國(guó)內(nèi)AI企業(yè)在此領(lǐng)域的快速推進(jìn)。
今年2月,Sora的首次亮相標(biāo)志著視頻大模型行業(yè)的黃金發(fā)展期正式開(kāi)啟。然而,令人意想不到的是,作為行業(yè)推動(dòng)者的Sora,在國(guó)內(nèi)市場(chǎng)卻面臨了激烈的競(jìng)爭(zhēng),甚至顯得有些掉隊(duì)。國(guó)內(nèi)市場(chǎng)上,騰訊、阿里巴巴、字節(jié)跳動(dòng)等互聯(lián)網(wǎng)巨頭紛紛推出了自己的AI視頻大模型,市場(chǎng)上一時(shí)間涌現(xiàn)出了不下二十款同類產(chǎn)品。
AI視頻大模型不僅賦予了AI更強(qiáng)大的理解和重構(gòu)真實(shí)世界的能力,也為用戶提供了無(wú)限的想象空間。與泛用場(chǎng)景的大語(yǔ)言模型不同,視頻大模型的使用場(chǎng)景更為專業(yè),因此現(xiàn)階段多需要付費(fèi)才能隨心生成視頻。免費(fèi)用戶通常只能依靠系統(tǒng)積分或每日贈(zèng)送的次數(shù)生成視頻,且可能無(wú)法體驗(yàn)部分高階功能。
在眾多國(guó)內(nèi)AI視頻大模型中,快手科技旗下的可靈無(wú)疑是先行者之一,其體驗(yàn)在眾多模型中名列前茅??伸`支持文生視頻和圖片生成視頻兩種模式,且能夠調(diào)整創(chuàng)意想象力和創(chuàng)意相關(guān)性。用戶可以通過(guò)文字描述生成最高5秒的高品質(zhì)視頻,或通過(guò)圖片生成最高10秒的標(biāo)準(zhǔn)品質(zhì)視頻,并支持運(yùn)鏡調(diào)節(jié)。一段描述寧?kù)o海灘的視頻生成后,無(wú)論是風(fēng)吹椰子樹(shù)的細(xì)節(jié),還是貓咪舔舐毛發(fā)的動(dòng)作,都表現(xiàn)得相當(dāng)出色,盡管生成的視頻場(chǎng)景是在白天而非夜晚。
抖音也不甘落后,推出了自己的視頻大模型即夢(mèng)。即夢(mèng)除了支持文生視頻和圖生視頻外,還加入了對(duì)口型功能,能夠根據(jù)文本或錄音調(diào)整視頻。即夢(mèng)更新迭代速度極快,目前已有多個(gè)版本可用。通過(guò)即夢(mèng)生成的視頻質(zhì)量也相當(dāng)不錯(cuò),但貓咪的動(dòng)作略顯單調(diào)和僵硬,樹(shù)葉也未隨風(fēng)而動(dòng)。
騰訊推出的混元視頻大模型則略顯稚嫩,生成的視頻質(zhì)量不如可靈和即夢(mèng)。騰訊混元目前僅支持文生視頻,且每日免費(fèi)生成次數(shù)有限。生成的視頻中,月亮顯得過(guò)于虛假,貓咪的動(dòng)作也充滿了違和感。
北京數(shù)生科技與清華大學(xué)聯(lián)合研發(fā)的Vidu大模型則表現(xiàn)出了不俗的實(shí)力。Vidu支持文生視頻和圖生視頻,還能根據(jù)同一主體不同角度的圖片生成更具真實(shí)感的立體畫(huà)面。生成的視頻質(zhì)量高,運(yùn)鏡自然流暢,細(xì)節(jié)豐富,唯一的漏洞在于沙灘的質(zhì)感稍顯不足。
智譜清言開(kāi)發(fā)的清影大模型雖然功能豐富,但生成的視頻質(zhì)量卻令人失望。畫(huà)面中幾乎看不到貓咪的存在,更像是一張靜態(tài)圖片。與同門師兄弟Vidu相比,清影在自然語(yǔ)言理解能力上還有待提升。
愛(ài)詩(shī)科技的PixVerse大模型則以其唯美的畫(huà)面風(fēng)格吸引了眼球。生成的視頻中,小貓的毛發(fā)細(xì)節(jié)和水面的波紋都表現(xiàn)得十分到位,但貓咪的動(dòng)作卻顯得有些僵硬。盡管如此,PixVerse的表現(xiàn)依然令人印象深刻。
從當(dāng)前的市場(chǎng)表現(xiàn)來(lái)看,國(guó)內(nèi)AI視頻大模型領(lǐng)域已呈現(xiàn)出群雄逐鹿的態(tài)勢(shì)。盡管各模型在細(xì)節(jié)上還存在一定的不足,但整體實(shí)力已不容小覷。未來(lái),隨著技術(shù)的不斷進(jìn)步和市場(chǎng)的日益成熟,AI視頻大模型有望在更多領(lǐng)域發(fā)揮重要作用。