您访问的页面找不回来了!
返回首页- 您感兴趣的信息加载中...
除了语音识别,还有语音合成,包括风格迁移。在互联网上,除了机器能识别你以外,当你在表达的时候,机器能够做更多辅助的工作,这个系统是先用14分钟我的语音做训练,然后跟特定的歌合成,我们可以把自己的音色做迁移,变成个性化合成,这是用我的声音来唱歌。所以语音里面,这样一个技术已经可以做到除了图像识别以外,还能做各种声音的变换,下面我们还可以展示更加先进的技术。
除了这样的迁移以外,我们现在还能做到的就是AI语音变声的技术,我们应该是首次将语音变声技术用到实际的产品里面,今年谷歌大会发表了语音表征识别的技术,我进行一下演示,可以把任何人的声音转化成特定的声音,这是在表征学习当中一个重大的突破,我们也是首次把它做了实用。这里点语音,然后点变声,我们做了很多人的特定音色,从明星,到卡通人物,到特别声音,比如高晓松,我可以给大家演示一下。
(高晓松声:大家好,欢迎来到极客公园2019年现场和大家一起分享人和机器的共创未来。)
还可以变成其他的动漫声音,游戏声音,或者剩下的方言。这样的变声技术并不是简单的语音合成,能把语音、语调、情感做到这样一个迁移。所以在输入法中间我们做了一件好玩的事情,大家意识到没有,这里只是好玩。可当我跟网络教育行业进行沟通的时候,整个行业沸腾了。
在远程的直播行业当中,我们遇到有些老师带有口音,我刚才是把一个普通话转成带有东北腔,但倒过来你口音能转成正常的语音,在知识付费的这种远程教育当中,这些学校的老师,或者说之前找的导游,会对他们有一个新的颠覆。
有一些导游声音可能不足够好听,但知识很渊博,对于一个网络的知识付费的公司而言,当他找不同人的时候也要考察他们的音色到底好不好。现在可以把任何一个人,5毛钱的音色变成价值50元的音色,而且当他找不同的老师或者导游的时候,产品也能做到非常标准化,因为输出高度一致。今天在表达信息和获取信息上,语音方面已经可以做到非常的突破了。
记者/闫妍 王小川是中国AI领跑者之一。 2017年,他和搜狗一起迎来了自己的高光时刻。身披的“中概股人工智能第一股”的外衣,以搜索引擎、输入法、浏览器起家的搜狗,正在围绕人工智尝试着更多的可能性