專題副刊

Alexa複製人聲模式 可切換自然聲調

隨着科技的發達,智慧語音助理已開始廣泛被用於民眾的日常生活之中。雖然它們促使民眾的生活更為便利,但若民眾總是面對單調空泛的機械音,不免覺得少了人情味。

近年來致力於發展智慧語音助理的亞馬遜傳出,該公司正在研究“複製人聲模式”,並希望在未來推出把預設人聲切換成已故親人聲音的功能。

Advertisement

亞馬遜Alexa團隊高級副總裁兼首席科學家Rohit Prasad日前在Re:Mars會議上介紹Alexa複製特定人聲的功能,根據當時所播放的影片,一名孩童對Alexa說:“奶奶能把綠野仙蹤讀完嗎?”接着,Alexa便切換掉預設的機器人聲,並以極度人性化的口吻模仿孩子的親人說話。

Prasad說,目前,該團隊已開發出技術雛形,現在的Alexa可以不到一分鐘的錄音產生高品質的語音,但有關功能目前還在開發中。

針對這項技術,Prasad認為,雖然人工智慧無法消弭民眾失去摯親的傷痛,但通過科技的幫助,將可讓民眾的記憶更加持久。

至於如何讓智慧語音助理的聲音聽起來不會太過死板,事實上,亞馬遜長年都想要讓智慧語音助理的音調更自然,在這之前,Amazon官方部落格曾指出,在美國地區的用戶已可以讓Alexa表達情緒,如高興、失望、激動、憐憫等口吻。

ADVERTISEMENT

只要偵測到用戶的問題,Alexa就可找到適合且特定內容的口語風格來作回應,這大大增加智慧語音助理的人性化反應。

據了解,Alexa之所以會有情緒,主要是利用神經TTS技術,也就是所謂的文本轉語音技術,讓Alexa可在回應用戶的問題時,能發出更自然的語音,並以更自然的語氣答覆。

舉個例子,當用戶喜歡的球隊在賽事中吃敗仗,那麼,Alexa便會使用失望的語氣來表達,而若是在播報新聞或演講時,Alexa的語氣也能被轉變為正經和端莊,以與民眾互動。

值得一提的是,Alexa的每種情緒也有不同的強度供選用,每當遇到不同的問答題時,Alexa也可呈現複雜的情緒。

此外,Alexa的口語風格也可作出些許變化,如在特定地區可展現特定的口音,而其對新聞與音樂的回應風格,用戶也可針對其語調、字詞、停頓時間等作調整。

Tags
【免責聲明】
光明網促請讀者及網民,共同維護言論自由精神,營造理性交流環境;任何人身攻擊、鼓吹種族與宗教仇恨、誹謗與造謠等留言,皆不代表本網站立場。 本網站有權刪除任何違反此原則的留言。

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *

你也可能感兴趣...