智譜公司近期推出了一款名為GLM-4-Voice的多模態(tài)語音模型,該模型在情感理解方面表現(xiàn)出色,能夠模擬高興、悲傷等多種情緒和語調(diào),實現(xiàn)與用戶間的情感共鳴。
GLM-4-Voice在對話中展現(xiàn)出高度的靈活性,用戶可以隨時打斷并調(diào)整語音輸出的內(nèi)容和風(fēng)格。同時,該模型還支持調(diào)整語速,以適應(yīng)不同場景的交流需求。
除了支持中英文語音外,GLM-4-Voice還能識別和表達(dá)粵語、重慶話和北京話等中國各地方言。未來,該模型還將結(jié)合視頻通話功能,為用戶提供全方位的交互體驗。
目前,GLM-4-Voice已作為智譜公司首個開源的端到端多模態(tài)模型,部署在“智譜清言”App上,供用戶即時體驗。