AlphaGo团队的新作品,AlphaZero一天干翻各路高手

2017-12-07 09:16:00 来源: 机器之能
分享到:
标签:

 

昨天,AlphaGo 研究团队提出了 AlphaZero:一种可以从零开始,通过自我对弈强化学习在多种任务上达到超越人类水平的新算法。据称,新的算法经过不到 24 小时的训练后,可以在国际象棋和日本将棋上击败目前业内顶尖的计算机程序(这些程序早已超越人类世界冠军水平),也可以轻松击败训练 3 天时间的 AlphaGo。
 
对于 DeepMind 来说,其最终目的远非在棋盘游戏中击败人类。他们希望可以打造出一种通用人工智能,解决更多的人类问题。虽然距离这一圣杯还很遥远,但是这周展示的最新研究成果显示,他们正走在正确的道路上。
 
在其发表的论文中,最初攻克围棋的 AI 程序的后代自学了许多其他游戏,均达到超人水平。经过八个小时地自我练习,击败最初战胜人类围棋冠军的 AI 程序,再经过四个小时的训练后,又击败了当前世界国际象棋冠军程序 Stockfish。更令人惊讶的是,仅经过两个小时的训练后,就战胜了世界最顶尖的日本将棋程序之一 Elmo。
 
AlphaZero 代表着 AI 技术一个非常关键的进步,那就是它不是专门为玩这些游戏而设定的。也就是说,没有任何人类关于这些游戏的经验被输入进 AlphaZero。在每个案例中,人类只给定 AlphaZero 基本规则,不编程其他策略或战术。在一次次自我对弈中,程序玩得更好,步伐不断加快,这种训练方式也就是所谓的强化学习。
 
强化学习技术的应用并不鲜见,今年 10 月亮相的 AlphaGo Zero 就是这一技术的成果。但是,正如本周发布的这篇论文所说,新版 AlphaZero 是 AlphaGo Zero「更加通用」的版本,这意味着 AlphaZero 能够被应用在更广阔的范围中,且无需事先过多准备。
 
最赞的地方是,在不到 24 小时里,同一个计算机程序就能自学如何玩这三种棋盘游戏,并超越人类水平。这可谓是 AI 世界的新壮举。
 
DeepMind 一直梦想着能够建造通用的人工智能,上述任务的成功完成使得 DeepMind 向这一愿景又靠近了一些,但前方仍旧充满挑战。今年早些时候,在 DeepMind CEO Demis Hassabis 展示 AlphaGo Zero 时,他提到,在未来将有一个能够解决更大范围内的科学问题的新版本出现,这一新版本能够肩负起从药物研发到新材料合成等一系列科研问题。这些问题和游戏不同,为了找出精确解决它们的方法,仍有大量工作摆在 DeepMind 面前。但我们现在可以肯定的是,人工智能正在前进,AlphaGo 也不仅仅是玩棋类游戏的 AI 了。
 
 
关注与非网微信 ( ee-focus )
限量版产业观察、行业动态、技术大餐每日推荐
享受快时代的精品慢阅读
 

 

继续阅读
NVIDIA 发布TITAN V GPU,将PC变身AI超级计算机
NVIDIA 发布TITAN V GPU,将PC变身AI超级计算机

NVIDIA(纳斯达克代码:NVDA )宣布推出 TITAN V GPU,它基于当前世界上最先进的 GPU 架构 NVIDIA Volta,可谓全球最强大的PC级GPU。

Imagination Technologies 2018年预测

018年即将到来,对于人工智能、增强现实、虚拟现实、物联网以及自动驾驶这些行业的热点技术来说,新的一年意味着什么呢?新一年又将出现哪些值得期待的创新和颠覆性技术呢?对此,Imagination Technologies做出如下预测:

赛格威-纳恩博CEO高禄峰应邀出席2017中国企业领袖年会
赛格威-纳恩博CEO高禄峰应邀出席2017中国企业领袖年会

12月9日,由《中国企业家》杂志社主办的“2017(第十六届)中国企业领袖年会”在北京成功开幕。本届中国企业领袖年会主题为“相信未来,激活企业家精神”,汇聚了各政府部门相关领导、各领域知名企业家和行业大咖精英等。

是德科技提出2018科技洞察及趋势预测

区块链是比特币之类的数字货币背后的支撑技术。由于其内在的高安全性,该技术很有可能会被更多领域的应用所采用。

以S7-300为可编程逻辑控制器的基于PLC电子密码锁的设计
以S7-300为可编程逻辑控制器的基于PLC电子密码锁的设计

西门子S7-300可编程逻辑控制器(Programmable Logic Controller,PLC)在工业控制系统中有较为广泛的应用,但一直以来缺少密码锁方面的相关研究。

更多资讯
电子工程师必须知道的JTAG知识,你都知道吗?
电子工程师必须知道的JTAG知识,你都知道吗?

JTAG(Joint Test AcTIon Group,联合测试行动组)是一种国际标准测试协议(IEEE 1149.1兼容)。标准的JTAG接口是4线——TMS、TCK、TDI、TDO,分别为模式选择、时钟、数据输入和数据输出线。

液晶屏LVDS接口的驱动原理及电路分析
液晶屏LVDS接口的驱动原理及电路分析

液晶显示器驱动板输出的数字信号中,除了包括RGB数据信号外,还包括行同步、场同步、像素时钟等信号,其中像素时钟信号的最高频率可超过28MHz。采用TTL接口,数据传输速率不高,传输距离较短,且抗电磁干扰(EMI)能力也比较差,会对RGB数据造成一定的影响。

JTAG与JLink有啥不同?看完这个你就知道了
JTAG与JLink有啥不同?看完这个你就知道了

J-Link是SEGGER公司为支持仿真ARM内核芯片推出的JTAG仿真器。配合IAR EWAR,ADS,KEIL,WINARM,RealView等集成开发环境支持所有ARM7/ARM9/ARM11,Cortex M0/M1/M3/M4, Cortex A5/A8/A9等内核芯片的仿真,与IAR,Keil等编译环境无缝连接。

JLink和JTAG接口引脚定义和使用方法
JLink和JTAG接口引脚定义和使用方法

TCK在IEEE1149.1标准里是强制要求的。TCK为TAP的操作提供了一个独立的、基本的时钟信号,TAP的所有操作都是通过这个时钟信号来驱动的。

一份美国雇主评级网站报告,了解2018年最抢手的人工智能公司

Facebook、NVIDIA、Adobe、微软、Uber 和埃森哲是2018年最佳的五家人工智能公司。在 Glassdoor 网站上,这五家公司就已经公布了 96 个新的 AI 职位,占到网站总发布职位的 18.7%。

微话题

工作 or 考研?

又到一年招聘季,考研or工作让你实现了怎样的逆袭?……
Moore8直播课堂