微软发布了新的文本到语音化身工具,使用户可以通过文本输入创建会说话的化身视频

健康作者 / 花爷 / 2025-09-21 00:25
"
      旧金山,11月16日:微软推出了一项具有视觉功能的文本转语音新功能,用户可以通过文本输入创建会说话的化身视频,并

  

  

  旧金山,11月16日:微软推出了一项具有视觉功能的文本转语音新功能,用户可以通过文本输入创建会说话的化身视频,并使用人类图像训练构建实时互动机器人。

  它被称为Azure AI语音文本,并在公开预览中提供,允许客户创建2D逼真化身说话的合成视频。该公司在周三晚些时候的“微软点燃”活动上表示:“神经文本到语音的化身模型是由基于人类视频记录样本的深度神经网络训练的,化身的声音是由文本到语音的语音模型提供的。”

  有了文字到语音的化身,用户可以创造更吸引人的数字互动。他们可以使用化身来建立会话代理、虚拟助手、聊天机器人等等。设计文本转语音化身的目的是保护个人和社会的权利,促进透明的人机交互,并遏制有害深度伪造和误导性内容的扩散。

  出于这个原因,自定义头像是一个有限的访问功能,只有注册才能使用,而且只适用于某些用例。要在您的业务应用程序中访问和使用该功能,请在这里注册您的用例并申请访问。”

  该公司目前提供两种独立的文本到语音化身功能:预构建文本到语音化身和自定义文本到语音化身。“微软在Azure上为其订阅者提供了预构建的文本到语音化身,作为开箱即用的产品。这些化身可以根据输入的文本说不同的语言和声音。客户可以从各种选项中选择一个虚拟形象,并使用它来创建视频内容或具有实时虚拟形象响应的交互式应用程序。”

分享到
声明:本文为用户投稿或编译自英文资料,不代表本站观点和立场,转载时请务必注明文章作者和来源,不尊重原创的行为将受到本站的追责;转载稿件或作者投稿可能会经编辑修改或者补充,有异议可投诉至本站。

热文导读