八达娱乐城
联系方式
八达国际手机版
电 话:063-********
传 真:063-********
联系人:陈经理
邮 编:580000
邮 箱:admin@XXX.com
官 网:http://www.framem.com
地 址:菲律宾马尼拉
您现在的位置: > 八达娱乐城 > 内容

Facebook开放源代码,只需一个GPU就能击败专业玩家.

发布时间:2018-08-09 编辑:佚名
正文|骆驼 李iphone -深圳报道 雷锋的人工智能技术评论新闻: 5月2日,Facebook ai research ( fair )网站blog宣布开源其人工智能围棋机器人elf opengo (包括源代码和一个训练有素的模型),它是在elf平台上开发的,击败了世界前30名棋手.。 根据雷锋网络的说法,这部作品主要是受到内心深处作品的启发.。 fair今年早些时候开始了这项工作,希望基于深入学习研究开发的可扩展轻量级框架( elf )能够再现alphagozer的最新成果.。 其目的是创建一个开放源码系统,可以自学,然后达到专业人员或更高的水平. 同时,他们也希望通过发布的代码和模型,能够启发更多的人思考这一技术的新应用和研究方向.。 据项目负责人田元东介绍,他们用2000个GPU对该模型进行了培训,大约两到三周后,他们得到了目前版本的go ai模型,基本上超过了强大的职业玩家的水平.。 elf opengo在比赛中以14 : 0赢得了所有比赛,4名职业围棋选手(金志锡、沈振、朴永勋和崔哲瀚)位列世界前30名. opengo使用单个GPU在游戏中搜索每一步50秒(每一步80,000个情况),而人类玩家可以思考任何长时间.。 此外,elf opengo与leela zero成对,leela zero是目前公众中最强大的围棋机器人,采用除池塘er之外的默认配置,并公开了重量( 192 x15,158603 EB,apr. 2018 ),opengo因此赢得了所有200场比赛。 医生. 田元东后来在胡志发表的一篇感情文章中写道,opengo是“不做最好的围棋程序,更不要说打败谁.”。 执行此项目有三个目的: ( 1 )α0 /αero算法非常有趣. 我们想知道它为什么工作,它是如何工作的,它是否是广告中所宣传的最佳实践的通用算法,以及只要机器堆积起来,强大的人工智能是否会立即出现.? 或者该算法中是否存在任何问题或弱点?? 《心灵深处》没有开源或披露细节,文章中的某些部分也写得不清楚.。 我以前写过博客讨论,但没有亲身经历,我总是不太踏实.。 因此,为了符合研究的目的,我们需要再现它. 首先,我们必须先复制它,然后才能进行创新. 这是做研究的习惯.。 ( 2 )今年年初,我重写了elf的核心代码,增加了分布式培训,所以我需要找到一个具体的应用程序来测试它.。 从这个角度来看,阿尔法0 /阿尔法0是一个完美的选择. 此外,以前在dare forest和go程序的代码中有经验,所以不需要太多的努力就能把它们拼在一起.。 ( 3 )无论是一般的算法还是分布式平台,它都可以用来做很多其他的事情,不一定要去,不一定要游戏.。 如果我们看一下elf opengo的代码,我们会发现它的很大一部分与go无关,它完全适用于其他方向的工作.。 但是go只是一种为我们做好算法和平台工作的手段.。 在这一点上,值得花一些时间做得好.。 医生. 田元东说,随着elf opengo今天的发布,这三个目标已经实现.。 当然,他们也想借此机会推广elf平台和py火炬深度学习框架,让更多的人能够使用和完善它.。 请参阅代码: 模型如下: 参见英文博客: 在c++方面,elf和c++线程同时主持多个游戏. 在python方面,elf可以一次返回一批游戏状态,这使得它对现代密集学习非常友好.。 相比之下,其他平台(例如open ai gins )仅使用python接口来封装单个游戏,这使得并发游戏的执行(这是许多现代强化学习算法所需要的)更加复杂.。 精灵有以下特点: 端到端: elf为游戏研究提供了端到端的解决方案。 它提供了一个小型的实时战略游戏环境、并行仿真、直观的API和基于web的可视化,并具有py torch授权的增强的学习后端,所需资源最少.。 扩展性:任何带有c / c++接口的游戏都可以通过编写一个简单的包装器插入到这个框架中.。 轻量级:精灵跑得很快,开销很小.。 在macbook pro上,基于RTS引擎的简单游戏(迷你RTS )可以在elf平台上每秒运行40 k帧. 从零开始,只需六天的时间就可以训练出六个CPU + 1个GPU的小型即时战略.。 灵活性:环境和参与者之间的配对非常灵活。 例如,单个代理和单个环境(例如香草a3c )、多个代理和单个环境(自播放/ mcts )、或者单个代理和多个环境( batcha 3c、ga3c )等.。 此外,任何建立在RTS引擎上的游戏都可以完全访问其内部表示和动态.。 通过opengo开源,fair还改进了elf平台,升级了更高效、更友好的API,支持了成千上万台计算机的分布式计算框架.。 作为py火炬的一部分,elf可以是一个快速灵活的实验,研究人员可以很容易地尝试不同的强化学习思想.。 -结束- ◆搅拌机 注意回复否.2 .与读者交朋友. 资料来源: http : / /万维网. 义田子胥. 内容? 身份证号码= 45684110

上一篇:亲密的! 我住在这里,不用担心快递和通道。

下一篇:没有了

Copyright © 2005-2018 http://www.framem.com 八达国际手机版版权所有