騰訊近日震撼發(fā)布了其最新研發(fā)的AI圖像生成利器——混元圖像 2.0(Hunyuan Image 2.0),并已在混元官方平臺(tái)開放注冊(cè)體驗(yàn)。這一創(chuàng)新成果標(biāo)志著騰訊在AI圖像生成領(lǐng)域的又一重大突破。
混元圖像 2.0采用了突破性的圖像編解碼器技術(shù)和全新設(shè)計(jì)的擴(kuò)散架構(gòu),使得其參數(shù)量相比前代實(shí)現(xiàn)了質(zhì)的飛躍。在生成速度方面,該模型更是達(dá)到了毫秒級(jí)響應(yīng),遠(yuǎn)遠(yuǎn)超越了市面上同類商業(yè)產(chǎn)品普遍需要的5至10秒推理時(shí)間。用戶現(xiàn)在可以在輸入指令的同時(shí),即時(shí)看到生成的圖像,徹底告別了傳統(tǒng)模式下漫長(zhǎng)的等待過程。
不僅如此,混元圖像 2.0還通過引入強(qiáng)化學(xué)習(xí)算法和海量人類美學(xué)知識(shí)的融合,使得生成的圖像更加細(xì)膩且富有真實(shí)感。這一進(jìn)步有效解決了AIGC圖像中常見的“AI痕跡”問題。在權(quán)威評(píng)測(cè)平臺(tái)Geneval上,混元圖像 2.0的表現(xiàn)尤為亮眼,準(zhǔn)確率高達(dá)95%以上,遙遙領(lǐng)先于其他同類模型。
混元圖像 2.0還為用戶帶來了前所未有的實(shí)時(shí)繪畫板功能。這一功能充分利用了模型的實(shí)時(shí)生成能力,用戶在進(jìn)行線稿繪制或參數(shù)調(diào)整時(shí),預(yù)覽區(qū)會(huì)同步呈現(xiàn)出上色效果,極大地提升了創(chuàng)作效率和體驗(yàn)。更令人驚喜的是,實(shí)時(shí)繪畫板還支持多圖融合功能,用戶只需上傳多個(gè)草圖,AI便會(huì)自動(dòng)調(diào)整透視和光影,根據(jù)提示詞生成融合圖像。
除了文字輸入外,混元圖像 2.0還貼心地加入了語音輸入功能。用戶只需通過語音指令,系統(tǒng)便會(huì)自動(dòng)將其轉(zhuǎn)化為文字,并即時(shí)生成相應(yīng)的圖像。這一創(chuàng)新設(shè)計(jì)無疑為那些不擅長(zhǎng)打字或追求更便捷操作方式的用戶提供了極大的便利。