近日,阿里巴巴在AI技術(shù)領(lǐng)域邁出了重要一步,正式對外開源了其先進(jìn)的視頻生成與編輯模型——通義萬相Wan2.1-VACE。這款模型不僅功能強大,而且兼容性廣泛,能夠一次性涵蓋從文字到視頻的生成、圖像參考視頻制作、視頻重繪、局部編輯、背景延展及時長延展等一系列基礎(chǔ)操作。
據(jù)《科創(chuàng)板日報》的相關(guān)報道,通義萬相Wan2.1-VACE此番開源提供了兩個版本,分別是1.3B和14B。尤為較輕量級的1.3B版本對硬件要求相對較低,即便是普通消費級顯卡也能流暢運行,這無疑大大降低了用戶的使用門檻。
通義萬相作為阿里云通義系列中的一員,自2023年7月7日上線以來,便以其在AI繪畫創(chuàng)作領(lǐng)域的卓越表現(xiàn)贏得了廣泛關(guān)注。而在2024年9月的阿里云棲大會上,阿里更是推出了通義萬相的視頻生成大模型,該模型不僅能夠生成高質(zhì)量的影視級視頻,還特別擅長理解和處理中文指令,進(jìn)一步提升了其實用價值。
回顧通義萬相的發(fā)展歷程,其視頻生成模型在短短數(shù)月內(nèi)便實現(xiàn)了從初步版本到2.1版的飛躍。今年1月,通義萬相宣布模型升級至2.1版,此次升級在多個關(guān)鍵領(lǐng)域取得了顯著突破,包括復(fù)雜運動處理、真實物理規(guī)律還原、電影質(zhì)感提升以及指令遵循優(yōu)化等。這些改進(jìn)使得模型在生成高質(zhì)量視頻方面更加得心應(yīng)手。
而在2月25日,阿里巴巴更是做出了一個大膽的決定,全面開源旗下的通義萬相2.1視頻生成模型。這一舉措不僅彰顯了阿里巴巴在AI技術(shù)領(lǐng)域的開放態(tài)度,更為全球開發(fā)者提供了一個學(xué)習(xí)和探索先進(jìn)視頻生成技術(shù)的寶貴平臺。