近期,一股名為“吉卜力畫風(fēng)”的熱潮席卷了網(wǎng)絡(luò)世界。這一趨勢的起點,可以追溯至3月26日,OpenAI推出的基于GPT-4o多模態(tài)大模型的高精度圖像生成功能——“4o Image Generation”。據(jù)OpenAI介紹,用戶只需通過簡單的文字描述,便能輕松實現(xiàn)廣告、平面圖、UI設(shè)計、LOGO風(fēng)格轉(zhuǎn)換等多種圖像創(chuàng)作需求。
然而,令人意想不到的是,這一技術(shù)迅速被廣大網(wǎng)友用于模仿日本著名動畫導(dǎo)演宮崎駿的畫風(fēng),一時間,網(wǎng)絡(luò)上涌現(xiàn)出大量“賽博宮崎駿”作品。無論是群聊中的頭像、表情包,還是對經(jīng)典歌曲的MV進行重新繪制,GPT-4o都展現(xiàn)出了驚人的創(chuàng)作能力,讓人嘆為觀止。推特上的國外網(wǎng)友更是樂此不疲,紛紛曬出自己的“吉卜力風(fēng)”作品。
在國內(nèi),類似的功能也并非空白。字節(jié)跳動推出的SeedEdit模型,同樣能夠?qū)崿F(xiàn)“自然語意修圖”。用戶只需輸入自然語言指令,便可對圖片進行多樣化的編輯操作。這一功能無需翻墻,直接在字節(jié)跳動的豆包官網(wǎng)上即可使用,且目前完全免費,無任何限制。
為了親身體驗這一功能,我們上傳了一張知名音樂錄像帶的截圖,并指令豆包和GPT-4o將其轉(zhuǎn)換為吉卜力風(fēng)格。對比兩者的作品,GPT-4o在衣物還原度和手部形態(tài)上表現(xiàn)更佳,但未能保持原圖比例;而豆包則在構(gòu)圖和配色上更接近原圖,但衣物細節(jié)有所變化,手部形態(tài)也略有變形。豆包還嘗試為原圖添加了額外的元素——一只抓著麥克風(fēng)的手。
除了吉卜力風(fēng)格,豆包還支持多種風(fēng)格的轉(zhuǎn)換。例如,將知名企業(yè)家馬斯克和喬布斯轉(zhuǎn)換為吉卜力或迪士尼風(fēng)格,效果同樣令人驚艷。豆包還嘗試將影視劇集中的名場面進行畫風(fēng)轉(zhuǎn)換,雖然與GPT-4o相比,在角色服裝和形態(tài)上略有不足,但整體效果依然十分出色。
然而,隨著吉卜力畫風(fēng)的火爆,也引發(fā)了一系列版權(quán)問題。早在2016年,宮崎駿就曾公開表示反對AI動畫技術(shù),認為這是對生命本身的侮辱。他堅持認為,AI生成圖像缺乏對生命力的敬畏。如今,技術(shù)的進步反而讓這一趨勢愈演愈烈,這無疑是對宮崎駿觀點的諷刺。
盡管如此,我們?nèi)钥梢試L試將這一技術(shù)視為一種全新的圖像編輯工具。例如,在設(shè)計行業(yè)中,“讓大象轉(zhuǎn)個身”這樣的需求,豆包都能輕松實現(xiàn)。生成的大象背面形象邏輯嚴謹,耳朵、腳部、身體顏色等細節(jié)都處理得相當(dāng)?shù)轿?,周圍環(huán)境也保持了一致性。
不過,在海報制作等方面,豆包的表現(xiàn)則稍顯不足。與GPT-4o相比,豆包在審美和細節(jié)處理上還有待提升。豆包在圖像生成時仍存在錯字現(xiàn)象,且在人像前后一致性和圖片內(nèi)容方向性上也有所欠缺。
盡管如此,豆包SeedEdit仍然填補了國產(chǎn)大模型在語義AI修圖應(yīng)用領(lǐng)域的空白。隨著AI圖像編輯技術(shù)的不斷發(fā)展,未來這一功能有望被集成到手機、電腦等日常設(shè)備中,成為普通人也能輕松上手使用的工具。屆時,無論是專業(yè)設(shè)計師還是普通用戶,都能通過這一技術(shù)將自己的審美理念直觀地展現(xiàn)出來。