您访问的页面找不回来了!
返回首页- 您感兴趣的信息加载中...
今日,猎豹移动董事长兼CEO傅盛在自己的抖音号上发布了一条视频。作为一名“科技乐观主义者”,傅盛和世界上的另一个“自己”进行了一场隔空对话。短短几十秒里,机器人“傅盛”的对答、绕口令样样精通。即使是仔细辨别,你也很难确认哪一个才是真正的傅盛。
能够达到如此惊艳的效果,其实要归功于猎豹移动旗下人工智能公司猎户星空研发的语音合成技术。只要听十段你的话,就可以克隆你的声音,听起来是不是很炫酷?
在人机交互的过程中,与用户体验感直接相关的,就是语音合成技术。这项技术是将文字转化为声音,可以简单地理解为人类的嘴巴。大家在各种智能语音助手中听到的声音,都是由TTS来生成的。所以,让TTS合成的语音能够“以假乱真”,正是TTS领域长期以来不断探索的主题。
传统的TTS都是怎么做的?
在看猎户星空如何实现“以小取大”的效果时,我们可以先看看以往的TTS是如何实现的。
传统的TTS系统通常包括前端、后端两个模块。前端模块主要负责对输入文本进行分析,提取语言学信息,如果是中文还涉及文本正则化、分词、词性预测、多音字消歧、韵律预测等,后端模块根据前端的分析结果,通过一定的方法生成语音波形。
后端系统的主流技术有两种,一种是基于统计参数建模的语音合成,或者叫做参数合成、参数法,优点是所需语料库少,几千句即可,训练与合成过程也都可以由程序自动完成,但缺点是语音质量不高,情感韵律平淡。
蓝鲸TMT频道11月5日讯,据海淀法院网披露,作曲家许镜清以侵害作品署名权、作品信息网络传播权纠纷为由将腾讯诉至法院,要求其停止侵权并索赔60余万
“至美天使,心有所薯”,近日游族网络3D魔幻MMOARPG手游《天使纪元》,携手国民零食品牌“洽洽”开启品牌联动,陆续推出包括专属豪华薯脆礼盒、合作宣传视频等在内的一系列合作定制内容
11月5日首届中国进口博览会正式召开,预计整个大会期间有40万人参会,除了作为参展商身临其境,广大市民还能通过线上的智能展馆系统周游大会