当前位置:经济频道首页 > 经济要闻 > 正文

对话博鳌AI同传负责人:为什么明知道可能搞砸,腾讯还坚持

2018-04-18 09:07:55      参与评论()人

澎湃新闻:为什么将“一带一路”的英语错误翻译成了“一路一带”?

李学朝:嘉宾在会场上发言比较口语化,在英文表达的时候把“一带一路”说反了,说成the road and belt,机器就把它当成字面的意思直译出来了。这就是人跟机器的区别吧。如果是人工的话,就有很大的容错,会把它翻译成“一带一路”。

澎湃新闻:既然是人工智能系统,为什么它没有反应过来是嘉宾说反了?

李学朝:这是当前人工智能翻译技术现状,它无法结合上下文去校对发言准确性,现在技术上一些学术圈内开始有这方面的研究,但是还没有到产品实用的阶段。目前,我们已专门针对上面“一带一路”可能的错误表达个例做了强制转化。不过人类语言很丰富,我们没有办法穷举所有可能说错的情况。

澎湃新闻:有张截图显示,AI同传过程中,出现不翻译情况,反倒生成了很多for。

李学朝:出现这个情况主要是包括神经网络机器翻译在内的深度学习算法,在原理上或多或少都有一定不确定性,在特定的情况下有一定概率引发翻译偏差。嘉宾重复说了4个for,刚好这种情况触发了系统把它翻译成更多的for出来,而翻译引擎不巧放大了这个重复,出现翻译错误,我们在技术与产品方面会有针对性优化。

澎湃新闻:像噪音、语言口音的问题怎么解决呢?

李学朝:之前大家看到的AI同传大多是用在单场个人演讲中,尽管那已经很复杂了,但相比讨论型会议,复杂度还是低的。博鳌这类国际讨论会议中,多国嘉宾同场参与、多种口音、多语自由切换或中英文夹杂,多噪音等特点,复杂度很高,对AI同传有极大的挑战。

硬件方面,可以用更多有指向性的设备,比如麦克风阵列;另一方面,也需要提高语音识别技术。这些问题需要学术圈、企业、科研机构等一起努力来解决的。

澎湃新闻:据现场记者反映,嘉宾如果中英文混着讲的话,AI翻译也会凌乱。

李学朝:中英混讲的情况,确实对系统也很挑战。目前我们系统的做法会判断这一句话到底中文多一些还是英文多一些,来决定翻译为哪种目标语言。在中英双语切换频繁或一个单句包含的中英文量级差不多时,后台中、英文识别引擎就会同时开始工作,会导致两种识别引擎互相“掐架“,翻译结果只能选择一种语言进行输出,有可能出现句子中的中文也被当作英文了,所以这时候就有可能出现翻译错误的情况。

相关报道:

    404 提示信息
    404

    您访问的页面找不回来了!

    返回首页
      您感兴趣的信息加载中...