智譜公司今日揭曉了其最新研發(fā)成果——GLM-4-Voice,一款端到端情感語音模型。該模型不僅具備情感理解與表達(dá)能力,還能實(shí)現(xiàn)情感共鳴,為用戶帶來更為真實(shí)的交互體驗(yàn)。用戶現(xiàn)在即可通過“智譜清言”App,親身體驗(yàn)這一創(chuàng)新技術(shù)。
GLM-4-Voice的亮點(diǎn)在于其豐富的情感表達(dá)和細(xì)膩的變化,能夠準(zhǔn)確傳達(dá)高興、悲傷、生氣、害怕等多種情緒。同時(shí),它還支持語速調(diào)節(jié),用戶可根據(jù)需要隨時(shí)要求加快或放慢語速。該模型還具備隨時(shí)打斷和靈活輸入指令的功能,使得對話互動(dòng)更加自然流暢。
在語言支持方面,GLM-4-Voice表現(xiàn)出色,不僅支持中英文語音,還能識(shí)別中國各地方言,如粵語、重慶話、北京話等。該模型還即將上線視頻通話功能,實(shí)現(xiàn)邊看邊說的全新交互體驗(yàn)。
智譜的另一大亮點(diǎn)AutoGLM也備受矚目,它具備phone use能力,能夠模擬人類操作手機(jī),無需用戶手動(dòng)搭建復(fù)雜工作流,操作邏輯與人類相似。
GLM-4-Voice已同期對外開源,成為智譜首個(gè)開源的端到端多模態(tài)模型。感興趣的用戶可訪問以下代碼倉庫了解更多詳情:
https://github.com/THUDM/GLM-4-Voice
GLM-4-Voice的開源將有助于推動(dòng)相關(guān)領(lǐng)域的進(jìn)一步研究與發(fā)展,為行業(yè)注入新的活力。