当前位置:经济频道首页 > 科技前沿 > 正文

真假难辨?猎户星空10段话克隆你的声音!

2018-11-06 09:00:20    快科技  参与评论()人

今日,猎豹移动董事长兼CEO傅盛在自己的抖音号上发布了一条视频。作为一名“科技乐观主义者”,傅盛和世界上的另一个“自己”进行了一场隔空对话。短短几十秒里,机器人“傅盛”的对答、绕口令样样精通。即使是仔细辨别,你也很难确认哪一个才是真正的傅盛。

能够达到如此惊艳的效果,其实要归功于猎豹移动旗下人工智能公司猎户星空研发的语音合成技术。只要听十段你的话,就可以克隆你的声音,听起来是不是很炫酷?

真假难辨?猎户星空10段话克隆你的声音!

在人机交互的过程中,与用户体验感直接相关的,就是语音合成技术。这项技术是将文字转化为声音,可以简单地理解为人类的嘴巴。大家在各种智能语音助手中听到的声音,都是由TTS来生成的。所以,让TTS合成的语音能够“以假乱真”,正是TTS领域长期以来不断探索的主题。

传统的TTS都是怎么做的?

在看猎户星空如何实现“以小取大”的效果时,我们可以先看看以往的TTS是如何实现的。

传统的TTS系统通常包括前端、后端两个模块。前端模块主要负责对输入文本进行分析,提取语言学信息,如果是中文还涉及文本正则化、分词、词性预测、多音字消歧、韵律预测等,后端模块根据前端的分析结果,通过一定的方法生成语音波形。

真假难辨?猎户星空10段话克隆你的声音!

后端系统的主流技术有两种,一种是基于统计参数建模的语音合成,或者叫做参数合成、参数法,优点是所需语料库少,几千句即可,训练与合成过程也都可以由程序自动完成,但缺点是语音质量不高,情感韵律平淡。

关键词:

相关报道:

    404 提示信息
    404

    您访问的页面找不回来了!

    返回首页
      您感兴趣的信息加载中...

    相关新闻