亚洲精品国产a久久久久久,亚洲 激情 ,欧美精品,亚洲av日韩综合一区在线观看,亚洲精品不卡av在线播放,无码国产69精品久久久久同性

資訊在沃

騰訊混元視頻大模型實(shí)測(cè):功能豐富,但細(xì)節(jié)待提升

   發(fā)布時(shí)間:2024-12-05 22:40 作者:趙云飛

在科技日新月異的今天,人工智能領(lǐng)域再次迎來(lái)了重大突破。曾幾何時(shí),OpenAI宣布將推出文生視頻大模型Sora,這一消息猶如一顆石子投入平靜的湖面,激起了全球網(wǎng)友的廣泛討論和期待。然而,時(shí)間悄然流逝,Sora似乎仍停留在概念階段,未見(jiàn)真容。反倒是亞馬遜云科技捷足先登,發(fā)布了名為Nova Reel的文生視頻大模型,谷歌也不甘落后,向企業(yè)用戶開(kāi)放了AI視頻模型Veo。

與此同時(shí),國(guó)內(nèi)互聯(lián)網(wǎng)巨頭們也在緊鑼密鼓地布局AI生成視頻領(lǐng)域??焓制煜碌腁I團(tuán)隊(duì)率先打造出視頻生成大模型可靈,清華大學(xué)與北京數(shù)生科技攜手推出了Vidu,隨后騰訊公司的AI團(tuán)隊(duì)也加入了這場(chǎng)競(jìng)賽,推出了混元文生視頻大模型,并在其元寶App中上線供用戶體驗(yàn)。

騰訊,作為國(guó)內(nèi)首屈一指的互聯(lián)網(wǎng)公司,在游戲、即時(shí)通訊、移動(dòng)支付等領(lǐng)域擁有舉足輕重的地位。然而,過(guò)去騰訊的技術(shù)研發(fā)能力時(shí)常受到外界的質(zhì)疑。此番,騰訊與亞馬遜云科技、谷歌等國(guó)際巨頭同期推出視頻生成大模型,無(wú)疑是對(duì)其研發(fā)實(shí)力的一次有力證明。

然而,技術(shù)的優(yōu)劣終究要靠實(shí)踐來(lái)檢驗(yàn)。騰訊混元視頻模型的實(shí)際表現(xiàn)如何呢?據(jù)用戶反饋,混元大模型擁有130億的參數(shù)量,是目前參數(shù)量最大的開(kāi)源視頻生成類大模型。在公測(cè)期間,用戶每天可以獲得多次視頻生成機(jī)會(huì),且生成的視頻長(zhǎng)度為5秒。從功能上來(lái)看,混元大模型提供了豐富的視頻類型設(shè)置,如比例、風(fēng)格、景別等,操作簡(jiǎn)便易用。

然而,在實(shí)際使用過(guò)程中,用戶發(fā)現(xiàn)混元大模型生成的視頻雖然畫面逼真,但往往與用戶的預(yù)期存在偏差。例如,在描述“夕陽(yáng)西下,少女坐在靠窗的書桌前”的場(chǎng)景時(shí),生成的視頻中白人女孩的形象讓用戶感到“出戲”,且書桌、窗戶等細(xì)節(jié)并未得到很好的呈現(xiàn)。而在描述天氣變化的場(chǎng)景中,視頻中的天氣變化并未得到體現(xiàn),部分人物動(dòng)作也顯得虛浮不自然。

為了驗(yàn)證混元大模型的一致性問(wèn)題,用戶用相同的描述語(yǔ)和鏡頭設(shè)置再次生成了視頻。雖然兩次生成的視頻在細(xì)節(jié)上有所差異,但整體效果仍然未能完全滿足用戶的期待。相比之下,Vidu和可靈兩款大模型在相同描述語(yǔ)下的表現(xiàn)則更為出色,它們能夠更準(zhǔn)確地捕捉并呈現(xiàn)用戶描述中的細(xì)節(jié)和場(chǎng)景變化。

盡管如此,騰訊混元大模型作為新晉的視頻生成大模型,其表現(xiàn)仍然值得肯定。它已經(jīng)從0到1邁出了重要的一步,雖然目前還存在一些不足和需要改進(jìn)的地方,但相信在騰訊技術(shù)團(tuán)隊(duì)和資金的支持下,混元大模型有望在未來(lái)實(shí)現(xiàn)更快的成長(zhǎng)和進(jìn)步。

隨著全球互聯(lián)網(wǎng)巨頭們紛紛加入AI生成視頻的競(jìng)賽,2025年有望成為視頻生成大模型爆發(fā)的一年。屆時(shí),AI生成視頻的長(zhǎng)度將從數(shù)秒提升至分鐘級(jí),為全球文娛產(chǎn)業(yè)帶來(lái)前所未有的變革。在這場(chǎng)激烈的競(jìng)爭(zhēng)中,國(guó)內(nèi)企業(yè)如騰訊、快手等已經(jīng)及時(shí)入場(chǎng)并把握住了新時(shí)代的機(jī)遇。未來(lái),它們能否在全球視頻生成大模型行業(yè)中脫穎而出,讓我們拭目以待。

 
 
更多>同類內(nèi)容
全站最新
熱門內(nèi)容
本欄最新