英偉達(dá)近期揭曉了一項(xiàng)音樂(lè)與音頻領(lǐng)域的創(chuàng)新突破——Fugatto人工智能模型,這一技術(shù)能夠在音頻創(chuàng)作上展現(xiàn)出前所未有的靈活性與創(chuàng)造力。
Fugatto之所以引人矚目,是因?yàn)樗蚱屏藗鹘y(tǒng)AI的局限性,不僅擅長(zhǎng)分析現(xiàn)有的音頻素材,還能在此基礎(chǔ)上進(jìn)行創(chuàng)意性的修改與轉(zhuǎn)化。比如,它能夠?qū)⒁欢武撉傩汕擅畹剞D(zhuǎn)化為流暢的人聲演唱,或是調(diào)整錄音中的口音與情感,實(shí)現(xiàn)音頻的無(wú)縫轉(zhuǎn)換。
盡管英偉達(dá)尚未計(jì)劃將Fugatto技術(shù)向公眾開(kāi)放,但其在合成音頻領(lǐng)域的潛力及其可能引發(fā)的行業(yè)變革,已經(jīng)引起了廣泛的關(guān)注與討論。Fugatto所展現(xiàn)出的音頻處理能力,預(yù)示著音頻創(chuàng)作與編輯的未來(lái)將更加多元化與智能化。
然而,隨著生成式AI技術(shù)的快速發(fā)展,如何避免其被濫用也成為了亟待解決的問(wèn)題。特別是防止用戶利用此類(lèi)技術(shù)制造虛假信息,或是侵犯他人的版權(quán)與知識(shí)產(chǎn)權(quán),成為了英偉達(dá)等技術(shù)創(chuàng)新者面臨的重要挑戰(zhàn)。
行業(yè)內(nèi)的其他巨頭如OpenAI與meta,在音頻與視頻生成技術(shù)的研發(fā)上也保持著神秘的姿態(tài),尚未公布具體的時(shí)間表或計(jì)劃。這些公司對(duì)于未來(lái)技術(shù)的布局與規(guī)劃,同樣引人遐想與期待。