IT之家 10 月 25 日消息,智譜今天宣布上線 GLM-4-Voice 端到端情感語音模型。官方表示,其能夠理解情感,有情緒表達(dá)、情感共鳴,可自助調(diào)節(jié)語速,支持多語言和方言,并且延時(shí)更低、可隨時(shí)打斷,用戶即日起可在“智譜清言”App 上體驗(yàn)。
據(jù)介紹,GLM-4-Voice 具備如下特點(diǎn):
情感表達(dá)和情感共鳴:聲音有不同的情感和細(xì)膩的變化,如高興、悲傷、生氣、害怕等。
調(diào)節(jié)語速:在同一輪對話中,可以要求 TA 快點(diǎn)說 or 慢點(diǎn)說。
隨時(shí)打斷,靈活輸入指令:根據(jù)實(shí)時(shí)的用戶指令,調(diào)整語音輸出的內(nèi)容和風(fēng)格,支持更靈活的對話互動(dòng)。
多語言、多方言支持:目前 GLM-4-Voice 支持中英文語音以及中國各地方言,尤其擅長粵語、重慶話、北京話等。
結(jié)合視頻通話,能看也能說:即將上線視頻通話功能。
此外,智譜 AutoGLM 具備 phone use 能力,只需接收簡單的文字 / 語音指令,它就可以模擬人類操作手機(jī)。其不受限于簡單的任務(wù)場景或 API 調(diào)用,也不需要用戶手動(dòng)搭建復(fù)雜繁瑣的工作流,操作邏輯與人類類似。
GLM-4-Voice 同期對外開源,官方稱其為智譜首個(gè)開源的端到端多模態(tài)模型。IT之家附地址:
代碼倉庫:
https://github.com/THUDM/GLM-4-Voice
廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。