当前位置:经济频道首页 > 正文

脸书人工智能掌门杨立昆:AI有了糖霜和樱桃,蛋糕还没个影(3)

2017-07-06 18:02:23    澎湃新闻  参与评论()人

目前,人工智能最缺乏的是常识。什么是常识呢?比方说,“这个奖杯放不进箱子,它太小了”,和“这个奖杯放不进箱子,它太大了”,这两句话,人类从常识就可以知道,前面一个“它“指的是箱子,而后一个“它”指的是奖杯。这对计算机来说却不是直观的。

再比如说,在“汤姆拿起包离开房间”这个小视频中,人类可以很自然地理解这一连串动作背后的逻辑:手碰到包就要抓住,不然是拿不起来的;离开房间要先开门再关门。但计算机只看到了一系列单个动作。

因此,杨立昆总结道,“常识就是靠预测填补空白的能力。”人类在生活的耳濡目染中接收了大量信息,由此形成了常识。在信心不足的时候,靠因果逻辑就能补上空档。只有预测到行为的后果,才能谈得上“规划”。理性=预测+规划,这是杨立昆给出的公式。

计算机想要获得媲美人类的预测能力,必然需要海量的数据。这就是“无监督学习”想要实现的目标。

杨立昆使用了“蛋糕”比喻,描述机器学习的三大流派。纯粹的强化学习可以根据少量样本预测出一个分数,监督学习可以用人类给定的样本预测一个特定的类别,而无监督学习需要用大量样本,对任何被观察的物体给出任意方向上的预测,比如通过视频的上半段预测视频的下半段。

强化学习是蛋糕顶上缀着的一颗樱桃,监督学习是蛋糕表面的糖霜,虽然现在的人工智能看起来很漂亮,但人类对如何制作蛋糕胚本身——无监督学习,还是摸不着门路。

这个比喻看上去对强化学习不够尊重,因此杨立昆强调,这个蛋糕是黑森林蛋糕——黑森林蛋糕是一定有樱桃的。目前,强化学习在游戏程序领域,比如围棋和星际争霸,扮演着很重要的角色。

图说:“蛋糕”比喻

对抗训练(adversarial training)在无监督学习方面取得了一些成绩。即由一个生成网络,随机创造正确或错误的数据,再由一个鉴别网络鉴别数据与正确答案的区别。两个网络互相博弈,交互学习,逐渐向最优演进。不过,杨立昆认为,这离实现完全的无监督学习还很遥远。

那么,人工智能离人类的“理性”到底有多远呢?杨立昆的态度比较谨慎。虽然卷积神经网络最早的灵感雏形来源于对猫大脑皮层的研究,杨立昆并不感冒仿生学。鸟类对于飞机来说,最大的价值是证明了飞行是可行的,激励人类探索飞行。但最后造出飞机的原理,却和鸟类并不是一回事——振翅并不重要。大脑这台完美的“机器”激励人类去探索人工智能,但是需要多少时间、怎样的方式才能接近这个蓝图,谁也说不好。