使機(jī)器人的聲音適應(yīng)環(huán)境和社會(huì)背景
2022-05-13 16:16:34
?
來源:
導(dǎo)讀 人類可以根據(jù)不同的環(huán)境和社會(huì)情況調(diào)整自己的聲音,這有助于鞏固對(duì)我們互動(dòng)的信任。關(guān)于賦予機(jī)器人這種能力的可能性已經(jīng)進(jìn)行了大量研究。然
人類可以根據(jù)不同的環(huán)境和社會(huì)情況調(diào)整自己的聲音,這有助于鞏固對(duì)我們互動(dòng)的信任。關(guān)于賦予機(jī)器人這種能力的可能性已經(jīng)進(jìn)行了大量研究。然而,當(dāng)前的方法要么昂貴,要么平淡且缺乏表現(xiàn)力。
最近發(fā)表在 arXiv.org 上的一篇論文提出了一種數(shù)據(jù)驅(qū)動(dòng)的方法來生成機(jī)器人的聲音。
研究人員使用現(xiàn)成的視頻會(huì)議平臺(tái)來收集真實(shí)的上下文音頻語音數(shù)據(jù)。然后,確定可以在不同環(huán)境和社會(huì)環(huán)境中改善機(jī)器人聲音的相關(guān)特征。測試人類感知以更好地了解人類如何感知機(jī)器人聲音。
研究人員表明,人類更喜歡與社會(huì)和環(huán)境上下文相匹配的人聲,并且在這些上下文場景中,當(dāng)前的文本到語音和人聲之間仍然存在很大差距。
免責(zé)聲明:本文由用戶上傳,如有侵權(quán)請(qǐng)聯(lián)系刪除!