OpenAI狂虐Dota大神Dendi,AI称霸游戏界这事你咋看

本文系网易智能工作室(公众号smartman 163)出品。聚焦AI,读懂下一个大时代!

【网易智能讯8月14日消息】上周五晚,埃隆·马斯克的OpenAI团队在电子竞技领域一鸣惊人,跃居成为世界上最伟大的选手之一。

据悉,在上周五Dota 2国际邀请赛上,Open AI的机器人在Dota2 1v1比赛中战胜了Dota人类顶级职业玩家Dendi。至此,继横扫人类国际象棋大师和围棋大师后,人工智能如今又将风靡全球的电子竞技游戏Dota2攻陷。

比赛期间,Open AI公司的机器人表现是非常“强悍”的,不仅会卡兵、s补刀,还会s掉技能抬手,其进攻性超强,连续两局狂虐Dendi。如此“强悍”的Open AI机器人手法娴熟,出手“快”、“准”、“狠”,刀刀毙命,这不禁令Dendi求饶:“请放过我吧。”

针对此战情,马斯克很快就欢呼着发了推文,庆贺胜利。他写道:“OpenAI在竞争激烈的电子竞技领域中首次击败了世界上最优秀的选手。Dota 2比传统的棋类游戏复杂得多。”马斯克暗指自己的OpenAI机器人比AlphaGo更胜一筹。

尽管OpenAI这款机器人绝对是了不起的——它展示了一种对职业玩家的统治地位,但机器人并不会取代Dendi在团队中的位置。

什么是Dota2?

《DOTA 2》是一款由Valve开发免费的多人在线战斗竞技类游戏,其前身是魔兽争霸三及扩展版本冰封王座中的一张自定义游戏地图。截至目前,Dota2是steam平台上活跃人数最多的游戏之一,最高在线人数超过120万。

Dota2的游戏比赛在两个队伍间进行,每个队伍有五名玩家,每个队伍都有一条优势路。每个队伍的游戏目标是摧毁对面要塞中的远古遗迹。每个玩家从113位能力风格技能迥异的英雄中选择一位进行操控。

在比赛中,玩家在相互对抗的过程中为各自的英雄收集金钱、经验及道具。

双方玩家将在一幅地图上争夺地盘,杀死对方小兵和电脑控制的其他游戏单位,以增强他们的力量,并试图杀死对方以给自身队伍带来益处。

这些角色的特技不同,比如进攻、防守和支持,但是复杂多变的因素意味着人类棋手在几十种不同的风格、策略和角色中都只能扮演一个英雄。

战况回顾

然而,在1v1的模式中,两位玩家都被分配到同一个英雄——暗影恶魔(简称“影魔”),一个广受欢迎的进攻性英雄,被许多世界上最好的中路角色玩家所青睐。

胜利的规则很简单——杀死对方两次或摧毁一座防御塔的玩家则获胜。“影魔”并不是Dendi玩的最好的英雄,但他仍然是这个角色的顶级玩家。

本周早些时候,OpenAI报道称,他们的机器人击败了目前的1v1冠军Sumail(美籍巴基斯坦游戏玩家,曾获得过DOTA2第五届国际邀请赛冠军),以及世界上最好的中路玩家——Arteezy。

在这种格局的游戏中,OpenAI的机器人完全占据了主导地位。双方交锋过程中,在第一场比赛期间,主持人问Dendi:“你感觉它像一个‘人类选手’吗?”Dendi回答说:“不,这家伙真的很可怕。”他不停地说着,面对机器人放狠招,他还一度大叫“请放过我吧!”第一局比赛中,第一局Open AI机器人仅用10分钟就击败了Dendi(Dendi试图杀死机器人的同时,机器人杀死了他二次)。

第二场比赛中,机器人在开场的几分钟内无情地痛打了他一顿,他便投降了主动放弃了比赛,并拒绝进行第三场比赛。

OpenAI的这款机器人频繁展示高超的战术,阻止较小的单位,引诱着Dendi进入陷阱,并积极地采用战略并利用它来惩罚Dendi。之前,Dota 2的计算机控制算法可以与人类选手相抗衡,但它们的编程却相对初级。

在某种程度上,大多数专业人士都足够优秀,能够找到机器人游戏风格的策略和弱点,这样他们就可以轻松地开发和击败机器人。但是,这次的OpenAI机器人在上场之后几乎找不到弱点。

机器人构建

OpenAI机器人运行了一种改良版的机器学习算法,这意味着它会随着它的运行而进化和学习,并抛弃其代码的低级版本(该公司并没有具体地使用它的语言,但据一名程序员透露,这是一种遗传算法)。

该机器人学会了玩游戏,不过这个游戏是要打败它自己。OpenAI Dota 2团队的负责人Greg Brockman说,在早期阶段,决斗的暗影恶魔只是在地图上毫无目的地四处乱跑直到他们死去,但慢慢地,他们学会了一些策略,让他们更接近设定的获胜目标。

几周之后,他们就变得十分强大,足以击败专业选手。“这款机器人可以从零开始,在两周的时间内变得很强大,”他说。

“自我博弈”(self-play)是OpenAI研发的关键所在。据悉,这是一种用于学习和解决机器复杂任务的有效方法:与太强或者太弱的都手过招,它都无法从中学到任何东西,但是可以将自身作为竞争对手。

这次的机器人完全是在自我博弈下进行针对训练的,并没有使用模仿学习或树搜索。

未来5V5不是“梦”

OpenAI挑战Dota 2背后的故事

据悉,Dota 1v1是含有隐藏信息的复杂游戏,智能体需要通过学习计划、进攻策略,并从中学会误导对手。玩家技巧和手速的关联性也不那么强烈了。

而实际上,OpenAI的手速一般,和普通人类玩家大致相当。而要想在Dota中取胜,要求玩家培养出敏锐的直觉,并采取相应的应对措施。视频中,我们可以看到,该机器人已经通过自我博弈学会了预测其他选手的动作,并在不熟悉的场景下即兴发挥,刀刀毙命。

面对Dota繁琐复杂的游戏规则,该机器人并没有丝毫的“怯场”,应用自如。在训练之初,AI对于自己的所处的世界一无所知,从零开始学习,进行自我博弈,这其实意味着它和它的对手永远旗鼓相当,并不断取得进步,进而达到职业选手的水平。

当然,1v1模式的Dota并不是真正的Dota。但这是一个次要问题,就像棒球里的全垒打一样。你可以制造一个俯仰的机器人,它可以一直扔出完美的快速球,但是,要想建立一个机器人棒球运动员团队是完全不同的事。

无论是在编程方面,还是在最高级别的协调、沟通和战略方面,都面临着严峻的挑战。在完整的5v5版本游戏中,有成千上万的不定因素,那远比精简版的多很多——所以马斯克的胜利之声是在混淆实际的成就。

不过,OpenAI并没有就此止步。该公司表示,“下一步是创建一个Dota 2机器人团队,这些机器人可以与顶尖的人类团队进行竞争和协作”。这意味着,如果它采用同样令人印象深刻的技术,明年的TI8可能会有一个完整的机器人挑战者团队。

真实的世界

Dota全球大赛上,Dendi挑战OpenAI记录

当然,这其中的含义是,能够掌握复杂视频游戏的机器人也可以有其他的用途。“我们所建立的是一个普遍的学习系统,尽管它在很多方面仍然受到限制,但它仍然能击败最优秀的人类专家,”Brockman说,“这是朝着向建立更通用的系统迈出的关键一步,它可以学习真正复杂的、重要的现实世界里的任务,比如做一名外科医生。”

向来以建设安全可靠的通用人工智能为己任的OpenAI,通过“自我博弈(Self-Play)”从零开始训练这款电子竞技机器人。赛前,Open AI CTO Brockman对外透露了该款机器人在Open AI的指导下经历了一千次比赛的训练。

Brockman 还声称这个 bot 已经打败多个世界级职业玩家。接下来,该公司表示将要转战研究5V5,未来战胜人类世界级玩家不是“梦”。

OpenAI是我们工作的公司,其目标是确保这些强大的系统对我们所有人都是有益的。这也是马斯克计划的一部分。他的想法是,最终人工智能将比人类更聪明,而且人工智能必须在安全、受监管的情况下进行。

“没有人喜欢受到监管,但所有对公众构成威胁的东西(汽车、飞机、食品、药品等)都必须要受到监管。人工智能也应该是这样的。”上周五晚,马斯克发表推文说道。

人工智能目前可能不会对社会造成多大威胁,但在Dota2的比赛中,它确实很可怕。(选自:Inverse 编译:网易见外智能编译平台 校对:田俊宏)

SOURCE: http://tech.163.com/17/0814/12/CRQ4AP0600098IEO.html

上一篇:如何选人生第一辆SUV 这四款不可不看