IT之家3月4日消息 据微软官方发布,近期,Azure 认知服务中的语音服务的一部分——自定义神经语音 (Custom Neural Voice)——文本到语音功能已普遍推出。该功能将允许用户使用微软开创性的神经文本到语音模型,为应用创建高度逼真、类似人类的自定义语音。由于创建的语音非常逼真,微软限制了访问权限,以便用户负责任地使用这项技术。
微软表示,
“作为微软对负责任的人工智能承诺的一部分,我们设计和发布自定义神经语音的目的是保护个人和社会的权利,促进透明的人机交互,抵制有害的深层伪装和误导性内容的扩散。为此,我们对自定义神经语音的访问和使用进行了限制。”
IT之家获悉,要创建自定义语音,你只需录制音频并上传作为训练数据即可。Azure 语音服务将为你的录音创建一个独特的语音调整。自定义神经语音的声音逼真自然,可以代表品牌,让用户以自然的方式与应用进行对话互动。
微软强调,以下客户已经在使用这项最新的 TTS 功能。