道客优

1234
微软2020国际残疾人日特别活动:AI让有声读物更生动
2020-12-02 新浪数码 阅读:476

  新浪数码讯 12月2日下午消息,微软在北京举办2020国际残疾人日特别活动,展示了微软AI语音技术的最新进展——神经网络语音智能。神经网络语音智能拥有多音色、多情绪的能力,并且可以通过创作平台快捷的进行制作。同时,活动现场也举行了红丹丹“心目图书馆”有声内容捐赠仪式。

微软全球资深副总裁 洪小文微软全球资深副总裁 洪小文

  活动中,微软全球资深副总裁、微软亚太研发集团主席兼微软亚洲研究院院长洪小文博士发表主题演讲。洪小文首先强调了微软“予力全球每一人、每一组织,成就不凡”的使命。2020年,科技领域对全球GDP的贡献约有5%,预计到2030年将达到10%,微软也将一直致力于用足够包容的技术成就每个人,为所有人带来产品和服务。而人工智能也将继续从地球计划、技术无障碍、人道主义行为计划、文化遗产保护技术以及健康医疗技术六个方面,让世界变得更好。

微软全球技术院士 黄学东微软全球技术院士 黄学东

  随后,微软全球技术院士、微软Azure AI首席技术官黄学东博士也通过视频进行了分享:在微软亚洲研究院的努力下,微软的AI语音技术被整合为兼具使用和推广价值的智能有声内容创作平台,让没有接触过AI技术的人也能参与到有声内容的创作中,带来更丰富的有声内容。

红丹丹“心目图书馆”有声内容捐赠仪式红丹丹“心目图书馆”有声内容捐赠仪式

  在活动现场也举办了红丹丹“心目图书馆”有声内容捐赠仪式。红丹丹“心目图书馆”由北京红丹丹文化交流中心(以下简称红丹丹)设立,旨在为盲人提供有声图书借阅服务。红丹丹创办人郑晓洁表示,红丹丹在许多盲校调研时发现,现有的盲人书籍、有声内容普遍老旧,满足不了盲人的阅读需求,传统人工录制的有声内容也有着耗时长、数量少等缺点,与微软的合作可以带给盲人丰富的选择,让书籍能陪伴盲人的一生。

微软云计算与人工智能事业部首席产品总监丁秉公微软云计算与人工智能事业部首席产品总监丁秉公

  生动、丰富的语音合成如何实现?微软云计算与人工智能事业部首席产品总监丁秉公带来了相关技术的讲解:微软在语音合方面拥有最智能的语音合成、最广泛的全球语音覆盖、灵活的云和端调用以及强大的语音定制能力四大优势,在此基础上微软推出了神经网络语音智能,将输入的文本进行神经网络声学学习,并且进行神经网络声学解码后输出自然的有声音频。

神经网络语音智能拥有多音色、多情绪能力神经网络语音智能拥有多音色、多情绪能力

  与传统的智能语音相比,神经网络语音智能拥有多音色、多情绪能力,让有声内容声音不再单一。举例而言,神经网络语音智可以模拟新闻播报、客服、聊天等多种场景的说话风格,并且可以加入开心、不屑、生气等情绪,并且可以实现情绪的分级,让情感更细腻。除了平台声音外,神经网络语音智能也可以提供声音定制服务,设计符合企业、组织或个人品牌策略的声音,并且根据场景进行情感优化,打造独一无二的人设,实现自然的人机交互。

智能有声内容创作平台智能有声内容创作平台

  在实际使用中,微软打造的智能有声内容创作平台,通过智能的全自动生成模式和定制化的自由创作模式两部分,让不了解AI技术的志愿者,也可以通过简单的操作进行有声内容的创作。

“AI语音+公益”圆桌对话“AI语音+公益”圆桌对话

  活动最后,微软组织了“AI语音+公益”、“AI语音+行业”两场圆桌对话,分享了更多微软AI语音技术与红丹丹公益活动背后的故事。

道客优(www.daokeyou.top)提醒:本网站转载【微软2020国际残疾人日特别活动:AI让有声读物更生动】文章仅为流传信息,交流学习之目的,其版权均归原作者所有;凡呈此道客优的信息,仅供参考,本网站将尽力确保转载信息的完整性,如原作者对道客优转载文章有疑问,请及时联系道客优,道客优将积极维护著作权人的合法权益。
推荐阅读: