一种为伴侣机器人合成情感语音的新模型
在过去的几十年里,机器人专家设计了各种机器人来帮助人类。其中包括可以帮助老年人并作为伴侣改善他们的福祉和生活质量的机器人。
理想情况下,伴侣机器人和其他社交机器人应该具有类似人类的品质,或者被用户认为是离散的、善解人意的和支持性的。近年来,许多计算机科学家因此一直试图赋予这些机器人以人类护理人员或卫生专业人员通常会观察到的特性。
日立研发集团和筑波大学的研究人员开发了一种合成情感语音的新方法,可以让伴侣机器人模仿护理人员与老年人或弱势患者交流的方式。这种方法在 arXiv 上预先发表的一篇论文中提出,可以产生与用户的昼夜节律一致的情感语音,这是调节人类睡眠和清醒模式的内部过程。
“当人们试图影响他人做某事时,他们会下意识地调整他们的言语以包含适当的情感信息,”Takeshi Homma 等人在他们的论文中解释道。“对于一个以同样的方式影响人的机器人,它应该能够模仿人类说话时的情绪范围。为此,我们提出了一种模仿人类语音中情绪状态的语音合成方法。”
该方法将语音合成与情感语音识别方法相结合。最初,研究人员在一天中不同时间点收集的人类录音数据集上训练了一个机器学习模型。在训练期间,模型的情绪识别组件学会了识别人类语音中的情绪。
随后,模型的语音合成组件合成了与给定情绪对齐的语音。此外,他们的模型可以识别人类目标说话者(即护理人员)的语音中的情绪,并生成与这些情绪一致的语音。与过去开发的其他情感语音合成技术相反,该团队的方法需要较少的人工工作,旨在调整合成语音中表达的情感。
“我们的合成器接收一个情感向量来表征合成语音的情感,”研究人员在他们的论文中写道。“向量是使用语音情感识别器从人类话语中自动获得的。”
为了评估他们的模型在产生适当的情感语音方面的有效性,研究人员进行了一系列实验。在这些实验中,机器人与老年用户进行交流,并试图通过调整其语音中表达的情绪来影响他们的情绪和唤醒水平。
在参与者听完模型产生的样本和其他情绪中立的语音样本后,他们就自己的感受提供了反馈。他们还被问及合成语音是否影响了他们的唤醒水平(即,他们在听完录音后是否感觉更清醒或更困)。
他的研究人员在论文中写道:“我们进行了一项主观评估,让老年参与者听我们的方法生成的语音样本。” “结果表明,听样本让参与者在清晨感觉更活跃,在半夜更平静。”
结果非常有希望,因为他们表明他们的情感语音合成器可以有效地产生与大多数老年用户的昼夜节律一致的护理人员般的语音。未来,在 arXiv 上展示的新模型可以让机器人专家开发更先进的伴侣机器人,这些机器人可以根据一天中与用户互动的时间调整语音中的情绪,以匹配他们的清醒程度和唤醒。
免责声明:本答案或内容为用户上传,不代表本网观点。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。 如遇侵权请及时联系本站删除。