脸书人工智能掌门杨立昆：AI有了糖霜和樱桃，蛋糕还没个影(3)

小大

扫描到手机×

2017-07-06 18:02:23 澎湃新闻参与评论()人

目前，人工智能最缺乏的是常识。什么是常识呢？比方说，“这个奖杯放不进箱子，它太小了”，和“这个奖杯放不进箱子，它太大了”，这两句话，人类从常识就可以知道，前面一个“它“指的是箱子，而后一个“它”指的是奖杯。这对计算机来说却不是直观的。

再比如说，在“汤姆拿起包离开房间”这个小视频中，人类可以很自然地理解这一连串动作背后的逻辑：手碰到包就要抓住，不然是拿不起来的；离开房间要先开门再关门。但计算机只看到了一系列单个动作。

因此，杨立昆总结道，“常识就是靠预测填补空白的能力。”人类在生活的耳濡目染中接收了大量信息，由此形成了常识。在信心不足的时候，靠因果逻辑就能补上空档。只有预测到行为的后果，才能谈得上“规划”。理性＝预测＋规划，这是杨立昆给出的公式。

计算机想要获得媲美人类的预测能力，必然需要海量的数据。这就是“无监督学习”想要实现的目标。

杨立昆使用了“蛋糕”比喻，描述机器学习的三大流派。纯粹的强化学习可以根据少量样本预测出一个分数，监督学习可以用人类给定的样本预测一个特定的类别，而无监督学习需要用大量样本，对任何被观察的物体给出任意方向上的预测，比如通过视频的上半段预测视频的下半段。

强化学习是蛋糕顶上缀着的一颗樱桃，监督学习是蛋糕表面的糖霜，虽然现在的人工智能看起来很漂亮，但人类对如何制作蛋糕胚本身——无监督学习，还是摸不着门路。

这个比喻看上去对强化学习不够尊重，因此杨立昆强调，这个蛋糕是黑森林蛋糕——黑森林蛋糕是一定有樱桃的。目前，强化学习在游戏程序领域，比如围棋和星际争霸，扮演着很重要的角色。

图说：“蛋糕”比喻

对抗训练（adversarial training）在无监督学习方面取得了一些成绩。即由一个生成网络，随机创造正确或错误的数据，再由一个鉴别网络鉴别数据与正确答案的区别。两个网络互相博弈，交互学习，逐渐向最优演进。不过，杨立昆认为，这离实现完全的无监督学习还很遥远。

那么，人工智能离人类的“理性”到底有多远呢？杨立昆的态度比较谨慎。虽然卷积神经网络最早的灵感雏形来源于对猫大脑皮层的研究，杨立昆并不感冒仿生学。鸟类对于飞机来说，最大的价值是证明了飞行是可行的，激励人类探索飞行。但最后造出飞机的原理，却和鸟类并不是一回事——振翅并不重要。大脑这台完美的“机器”激励人类去探索人工智能，但是需要多少时间、怎样的方式才能接近这个蓝图，谁也说不好。

首页上一页 1 23共 3 页