您访问的页面找不回来了!
返回首页- 您感兴趣的信息加载中...
今年年初我们发布了另外一款技术,叫做AI的合成主播。这件事情把语音、图像和文字的关系完全联动起来,我前面讲的技术能够把嘴形识别变成声音、变成文字,现在我们倒过来,也是同样的技术,能把文字变成声音变成它的表情,并且在这里面我们年初已经在新华社和央视里面上线了这样一个产品。
这就是我们称之为的AI合成主播,能合成人的声音、嘴形、表情,同时也是我们全球首个用AI能取代人的分身技术。这个技术发布之后,全球100多家媒体都能做这样的报道。我们给大家看看效果。
这个技术在年初已经上线,全球很多媒体都会采购,包括国内最大的一家保险公司在线客服也将采用我们的技术,用机器取代部分人。在感知视觉里,机器和人沟通机器能做到很大的取代人的作用,独立开展工作。
这是我们做的机器翻译,包括语音同传,我们有非常丰富的落地场景,我们之前首个离线翻译引擎,用到离线翻译机,没有网络的情况下也能工作。我们也能在讲中文和英文的时候,翻译成其他国家的文字进行传递。我们还能翻译成全球的文字,全球更多的网络咨询是英文文写的,我们现在能用中文浏览很多内容。
今年初,我们还推出搜狗的录音笔,希望将语音的感知和认知技术更好地结合。因为这个领域,我们发现发现仅手机的场景已经不太够用。录音笔在重新定义录音笔行业,跟以前最大的区别是,当你关掉录音笔以后,它还能实时传到终端设备,并且实时转成文字,1小时的语音5分钟可以成稿。
为什么做这个工作呢?我们在医院里,当医生跟病人沟通时,我们可以用它生成病例。医疗整个大环境当中,信息化做得远远不够,最大的环境是门诊的地方。医生和病人的沟通,现在没有写成一个规范的病例,这使得我们整个医疗AI很难实现。
记者/闫妍 王小川是中国AI领跑者之一。 2017年,他和搜狗一起迎来了自己的高光时刻。身披的“中概股人工智能第一股”的外衣,以搜索引擎、输入法、浏览器起家的搜狗,正在围绕人工智尝试着更多的可能性