当前位置:经济频道首页 > 经济要闻 > 正文

人工智能学会团队协作,在《刀塔2》5人对决团战中击败人类

2018-06-26 14:25:51      参与评论()人

OpenAI的博客称,通过自我对抗学习,OpenAI Five每一天的训练量相当于人类玩180年的游戏时间。他们在几个月的时间都里以这种速度进行了训练。

“一开始,他完全是随机地,在地图上游荡。然后,几个小时后,它开始提高基本技能。”Brockman说。如果说一个人在玩了12000到20000小时的游戏后会成为一名专业人士,那就意味着OpenAI的算法每天积累的游戏经验是一个人一生积累经验的100倍。

在硬件上,OpenAI Five使用256块GPU、12.8万个CPU,核心使用近端策略优化(Proximal Policy Optimization)方法进行训练,这是OpenAI在去年建立的单独《刀塔2》系统上的扩增。

GPU即图像处理器。理解GPU和CPU之间区别的一种简单方式是比较它们如何处理任务。CPU由专为顺序串行处理而优化的几个核心组成,而GPU则拥有一个由数以千计的更小、更高效的核心(专为同时处理多重任务而设计)组成的大规模并行计算架构。

如此强大的训练量,一方面证明了机器学习算法和能处理海量数据的最新芯片的强大。但另一方面,这也提醒我们,AI系统实际上有多么的不智能。如果人类花上上千年时间仅学习一个电竞游戏,那人类也就不会成为现在的物种了。

人工智能也懂相互配合

与围棋、国际象棋等技术战略类游戏不同,《刀塔》这种多人联机在线竞技游戏类游戏有着更为复杂的游戏机制,还需要队友间完美的配合才能取得最终的胜利。而这次的5位AI“玩家”完美的证明了人工智能也懂得相互配合。

人工智能学会团队协作,在《刀塔2》5人对决团战中击败人类

《刀塔》的规则非常复杂,玩家们使用的英雄有各自的强项、弱项、技能和属性。在游戏里,玩家需要获得金钱,购买和升级装备,思考战略,还要和对手厮杀。这款游戏已经开发了十几年,拥有成百上千的代码行实现游戏逻辑。而且游戏每两周更新一次,环境语义一直在变。

相关报道:

    404 提示信息
    404

    您访问的页面找不回来了!

    返回首页
      您感兴趣的信息加载中...

    相关新闻