当前位置:经济频道首页 > 产经 > 正文

阿尔法狗“人肉臂”黄士杰:结束围棋项目,转战下个领域(2)

2017-12-14 09:19:41    澎湃新闻  参与评论()人

在整个时间线上,需要插一句的是, 2010年,戴密斯·哈萨比斯(Demis Hassabis)和大卫·席尔瓦(Dave Sliver)在伦敦成立了DeepMind。而当2011年,黄士杰到加拿大念博士后,并担任研究员时,大卫·席尔瓦于前一年离开阿尔伯塔大学。

到了2012年,戴密斯·哈萨比斯、大卫·席尔瓦和黄士杰才在伦敦相遇,而那时AlphaGo项目可能连想法都还没有形成。直到2014年1月,谷歌宣布用4亿英镑收购DeepMind,事情才有了质的突破。

据黄士杰回忆,有一天,席尔瓦走到他面前说:“Aja,我们准备启动一个围棋项目。最开始只有你和我”。当时团队只有三个人:哈萨比斯、席尔瓦、黄士杰。哈萨比斯是整个公司的老板,席尔瓦是黄士杰的经理。从三个人的职位来看,黄士杰需要干的活可能是最多的。

黄士杰落子瞬间  

给AlphaGo团队当围棋培训师

除了专业受到DeepMind团队青睐外,黄士杰对围棋的热爱也是团队看中的因素之一。黄士杰从小热爱围棋,在台师大读书时就曾经创办了学校的围棋社,是个业余六段围棋选手。除了爱下围棋外,他还对电脑棋类程序竞赛非常感兴趣。他曾自己开发过一款围棋程序,名为AjaGo。2010年,黄士杰开发的围棋程序Erica,在当年的围棋比赛中击败了日本著名“选手”Zen,获得当年的冠军。当时黄士杰在准备的博士论文也与围棋程序相关,题为《应用于电脑围棋之蒙地卡罗树搜寻法的新启发式演算法》。

随着AlphaGo团队的不断壮大,越来越多计算机方面、深度学习领域的人才加入其中,团队也不再只有3个人组成。但有个问题是,新加入团队的工程师,可能之前并不了解围棋规则,这就需要有人来为其普及知识。因此,黄士杰为新加入的同事办了一个训练班,普及基本的围棋规则。

有了新力量的加入,AlphaGo项目的推进突飞猛进。2016年1月27日,《自然》杂志以封面论文的形式,介绍了DeepMind团队开发的AlphaGo,以及它击败了欧洲冠军樊麾的消息。实际上,自那时起,黄士杰就已经成为了AlphaGo的人肉臂。在与樊麾比赛前,他还曾告诉过樊麾,AlphaGo非常厉害,但那时,樊麾没有听进去,也大意了。或许不只是樊麾大意了,即便《自然》已公布AlphaGo的成功,那时候,仍没有人能够相信人工智能程序能战胜人类职业棋手。直到同年3月份,它以4:1的成绩打败韩国棋手李世石,才真正意义上赢得了世界的刮目相看。

为您推荐: