AlphaGo进化：3天100：0碾压旧版不使用人类知识(2)

小大

扫描到手机×

2017-10-19 14:48:01 第一财经APP 参与评论()人

这种技术比上一版本的 AlphaGo 更强大，因为它不再受限于人类知识的局限。在进行了3天的自我训练后，AlphaGo Zero 在100局比赛中以100：0击败了上一版本的 AlphaGo——而上一版本的 AlphaGo 击败了曾18次获得围棋世界冠军的韩国九段棋士李世石。经过 40 天的自我训练后，AlphaGo Zero 变得更加强大，超越了“Master”版本的 AlphaGo——Master 曾击败世界上最优秀的棋士、世界第一的柯洁。

人工智能的探索无止境

围棋起源于中国，已经流传了近3000年。2016年春天，AlphaGo与世界围棋选手李世石的一场世纪人机大战，标志着人工智能取得了历史性的突破，更引发了一波人工智能创业热。一年之后，高智能的机器来到中国，打败了中国的顶尖选手。

AlphaGo的诞生惊艳了世人，现在AlphaGo Zero又将机器能做到的极限往后推了几个量级。

DeepMind的CEO得米斯·哈萨比斯( DemisHassabis)表示，“对我们来说，AlphaGo不仅限于在围棋对弈中获胜，这也是我们开发通用算法的一大进步。”大多数AI被认为“用途有限”，因为它们只能执行单一任务，例如，翻译、识别面孔。但通用型AI在许多不同任务上拥有超越人类的潜能。哈萨比斯认为，在接下来十年，AlphaGo的迭代产品将成为科学家和医学专家，与人类并肩工作。

DeepMind团队现在正在研究如何将与AlphaGo Zero相同的算法应用到真正的科学挑战中，比如蛋白质折叠、降低能耗、寻找新材料或发现新药。哈萨比斯表示:“我们正在努力建立通用学习算法，而这只是向前迈出的一步，但它的确令人感到兴奋不已。AlphaGo团队许多成员现在正在开发其他项目，并试图将这项技术应用到其他领域。”

当被问及DeepMind使用了多少资金开发AlphaGo时，哈萨比斯表示，这个数字“可能相当可怕”，很难量化。大约有15名DeepMind顶级员工年薪在六位甚至七位数以上，他们已经全职研发AlphaGo很长时间，而且该公司使用了大量的谷歌计算能力。

人机大战已经落幕，但人类围绕人工智能的探索才刚刚起步。

首页上一页 12共 2 页

关键词：Zero

AlphaGo进化：3天100：0碾压旧版 不使用人类知识(2)

为您推荐：

AlphaGo进化：3天100：0碾压旧版不使用人类知识(2)