國(guó)產(chǎn)視頻大模型廠商Vidu近日宣布,其全新版本Vidu 1.5已正式上線。該版本在技術(shù)上取得了重大突破,被譽(yù)為達(dá)到“世界領(lǐng)先水平”,尤其在處理多樣化輸入及解決“一致性”難題上表現(xiàn)卓越。
Vidu自上線以來(lái),便以其出色的角色一致性生成能力受到關(guān)注。通過(guò)精準(zhǔn)鎖定人物面部特征,Vidu成功解決了視頻生成中的關(guān)鍵痛點(diǎn),確保了人物形象的連貫性。而在Vidu 1.5中,廠商進(jìn)一步展現(xiàn)了其上下文學(xué)習(xí)能力,顯著提升了視頻模型的可控性。
新版本在三個(gè)方面顯著展示了技術(shù)上的革新與突破。首先,對(duì)于復(fù)雜主體,如細(xì)節(jié)豐富的角色或復(fù)雜物體,Vidu 1.5能夠在多個(gè)視角下保持高度的一致性。例如,在處理3D動(dòng)畫風(fēng)格角色時(shí),無(wú)論視角如何變換,其頭型、服飾等細(xì)節(jié)始終如一,有效避免了傳統(tǒng)模型在視角切換時(shí)可能出現(xiàn)的問(wèn)題。
其次,在人物特寫鏡頭中,Vidu 1.5自然且流暢地維持了人物面部特征和動(dòng)態(tài)表情的連貫性。這有效消除了面部僵硬或失真的現(xiàn)象,使得生成的視頻更加自然真實(shí)。
最后,Vidu 1.5還實(shí)現(xiàn)了多主體一致性。用戶現(xiàn)在可以上傳包括人物角色、道具物體、環(huán)境背景等多個(gè)主題圖像,并在視頻生成過(guò)程中實(shí)現(xiàn)這些元素的交互。這一功能為用戶提供了更高的自定義空間,能夠創(chuàng)造出更為豐富和個(gè)性化的視頻內(nèi)容。
Vidu 1.5的發(fā)布無(wú)疑標(biāo)志著國(guó)產(chǎn)視頻大模型技術(shù)邁上了新的臺(tái)階,其在處理復(fù)雜視頻生成任務(wù)時(shí)展現(xiàn)出的卓越性能和高度可控性,必將為用戶帶來(lái)更加出色的使用體驗(yàn)。