当前位置:经济频道首页 > 产经 > 正文

“暗黑版”AI现身引忧虑 我们需要怎样的人工智能?

2018-07-09 09:20:03    科技日报  参与评论()人

除了人训练机器的数据本身有偏差以外,机器通过对抗性神经网络合成的数据也可能有问题。由于机器不可能“见过”所有东西(比如识别桌子,机器不可能学习所有长短宽窄各异的桌子),人也不可能标记所有数据。如果研究者输入一个随机的噪音,机器可以向任何方向学习。这是一把双刃剑,机器也可能合成一些有问题的数据,学习时间长了,机器就“跑偏”了。

  数据的均衡或可减少“跑偏”

不少科学家以“garbage in, garbage out”来形容“数据和人工智能的关系”。中科视拓(北京)科技有限公司CEO刘昕说:“对机器学习而言,进什么就出什么。监督学习就是让模型拟合标签,比如训练者把帅哥都标记成‘渣男’,那么机器看到刘德华,就会认为他是……”谈到诺曼引发的讨论,刘昕表示:“不需要担心,人类本身就有各种歧视和偏见,用人类生产的数据训练AI,再批判AI不够正直良善,这么说有点危言耸听。”

偏见、刻板印象、歧视都是人类社会的痼疾,有些流于表面,有些深入社会肌理,无法轻易剥离。在这样的语境中产生的数据,携带着大量复杂、难以界定、泥沙俱下的观点。如果研究者没有意识到或着手处理这一问题,机器学习的偏见几乎无解。真正的“公正算法”或许是不存在的。

据有关媒体报道,在谷歌研究自然语言处理的科学家 Daphne Luong 表示,正确地校准标签对机器学习来说非常关键,有些数据集其实并不平衡,像维基百科上的数据,“他”(He)出现的次数远比“她”(She)要多。

王金桥也着重强调了“数据的均衡”。就算对人来说,不同人秉持着不同的价值观,但多听多看多受教育可以让人向良好的方向改进。机器学习也是如此。“训练机器时,要注重数据的均衡,给它更多可靠的数据。研究团队成员具有多元的学术背景(如吸纳更多社会学、心理学等领域学者加入)、性别、年龄、价值观,也可以帮助机器学习更加均衡,减少机器出现偏见、谬误甚至失控的可能。”王金桥说。

相关报道:

    404 提示信息
    404

    您访问的页面找不回来了!

    返回首页
      您感兴趣的信息加载中...

    相关新闻