你可能输给一个程序 会学习玩电子游戏的算法
deepmind公司的Demis博士开发了一个程序,可以自己独立钻研如何玩电子游戏,以及如何在游戏中获胜。
这个程序受到人脑运作机理的启发,已经自主学习、掌握了49款atari公司的经典游戏。在一半以上的游戏中,它的水平能不输给,甚至超过专业级的人类玩家。
可以独立学习如何完成一系列复杂的任务的程序还是第一次。这个项目的研究进展已经发到了著名的nature杂志上。
Demise Hassabis博士是deepmind的工程部副部长,他说:”在这之前,具有自主学习功能的软件只能学习相似的,简单的任务。我们这是第一次把它放在一个感性的、丰富的环境中,去完成一些对人类来说也有一些挑战性的任务。”
很多科技公司都在程序的自主学习这方面的研究中投入巨资。在2014年,谷歌收购了deepmind科技公司,对外公布的价钱是四百万英镑。
让软件掌握复杂的游戏,deepmind并非首创,之前已经有人做到过。IBM推出的深蓝,在1997年的一次比赛中击败了世界冠军Garry Kasparov。而deepmind的这个人工智能程序刚开始自主学习的时候,程序内部只有一些游戏规则的介绍和一点技巧的提示。和深蓝的区别在于,他们的这款程序在玩游戏之前,只是知道一些简单的信息,所以被他们戏称为“agent”。
Hassabis博士解释道:“我们只给了程序一些简单的信息,只有屏幕显示出来的画面以及游戏最后的得分越高越好这两项。其他的一切,这个程序只能自己慢慢研究。”
这个项目的团队展示了这款程序在49款电子游戏中的表现,从老式的游戏比如说Space Invaders和Pong,再到拳击和网球游戏,以及3D-racing challenge Enduro。
在29款中,程序的表现类似于或者强于人类。在游戏Pinball,Boxing和Breakout中,它的表现远超专家级人类的水平。但是它在Pac-man,Private Eye和Montezuma’s revenge中表现欠佳。
该程序在玩小蜜蜂时表现很棒,但玩起吃豆人则很困难
“现在再看这些游戏,因为这些游戏来自80年代,你可以非常轻松地写出玩这些游戏的程序,所以我们的程序看起来就会显得无关紧要。“
“重要的是,这个系统可以从一些很感性的信息---屏幕显示出的画面中,学会如何解决问题。“
“这个程序还能在没有提前编写解法的情况下玩49个来自xbox的游戏。你只用给它一个新的游戏,新的屏幕界面,然后等几个小时,它就能钻研出来大致是怎么玩的。“
这个研究是”深度学习“领域的最新进展,这个领域的研究正在为更聪明的机器的面世铺平道路。
科学家们正在研究一种可以就像人脑那样先处理像图像和声音那样很大量的数据,然后再提取出有用的信息的电脑程序。这项技术可以让机器扫描出成千上万幅图像后,明白它需要重点注意哪里。自动驾驶汽车需要对周围环境具有有效的感知,这对自动驾驶汽车的研发具有重要的意义。
也许这个程序也能用在声音识别上,用于高级的人声识别软件中,或者一些实时翻译的软件。
Hassabis博士说”在工厂,在照顾老人的机器和做家务的机器上,还有很多硬伤,其中之一是当这些机器到了真实世界,他们不得不处理一些意想不到的情况。你不可能对所有可能发生的不测都提前编好代码去应对。“
“在某种意义上,这些机器需要有自主学习和自主适应的功能。“
有些人担心真的造出来比人类强大的机器之后,人类的处境就会变得危险。去年12月霍金教授就曾说过,完善的人工智能技术“会让人类不复存在“。
来源:煎蛋
这个程序受到人脑运作机理的启发,已经自主学习、掌握了49款atari公司的经典游戏。在一半以上的游戏中,它的水平能不输给,甚至超过专业级的人类玩家。
可以独立学习如何完成一系列复杂的任务的程序还是第一次。这个项目的研究进展已经发到了著名的nature杂志上。
Demise Hassabis博士是deepmind的工程部副部长,他说:”在这之前,具有自主学习功能的软件只能学习相似的,简单的任务。我们这是第一次把它放在一个感性的、丰富的环境中,去完成一些对人类来说也有一些挑战性的任务。”
很多科技公司都在程序的自主学习这方面的研究中投入巨资。在2014年,谷歌收购了deepmind科技公司,对外公布的价钱是四百万英镑。
让软件掌握复杂的游戏,deepmind并非首创,之前已经有人做到过。IBM推出的深蓝,在1997年的一次比赛中击败了世界冠军Garry Kasparov。而deepmind的这个人工智能程序刚开始自主学习的时候,程序内部只有一些游戏规则的介绍和一点技巧的提示。和深蓝的区别在于,他们的这款程序在玩游戏之前,只是知道一些简单的信息,所以被他们戏称为“agent”。
Hassabis博士解释道:“我们只给了程序一些简单的信息,只有屏幕显示出来的画面以及游戏最后的得分越高越好这两项。其他的一切,这个程序只能自己慢慢研究。”
这个项目的团队展示了这款程序在49款电子游戏中的表现,从老式的游戏比如说Space Invaders和Pong,再到拳击和网球游戏,以及3D-racing challenge Enduro。
在29款中,程序的表现类似于或者强于人类。在游戏Pinball,Boxing和Breakout中,它的表现远超专家级人类的水平。但是它在Pac-man,Private Eye和Montezuma’s revenge中表现欠佳。
该程序在玩小蜜蜂时表现很棒,但玩起吃豆人则很困难
“现在再看这些游戏,因为这些游戏来自80年代,你可以非常轻松地写出玩这些游戏的程序,所以我们的程序看起来就会显得无关紧要。“
“重要的是,这个系统可以从一些很感性的信息---屏幕显示出的画面中,学会如何解决问题。“
“这个程序还能在没有提前编写解法的情况下玩49个来自xbox的游戏。你只用给它一个新的游戏,新的屏幕界面,然后等几个小时,它就能钻研出来大致是怎么玩的。“
这个研究是”深度学习“领域的最新进展,这个领域的研究正在为更聪明的机器的面世铺平道路。
科学家们正在研究一种可以就像人脑那样先处理像图像和声音那样很大量的数据,然后再提取出有用的信息的电脑程序。这项技术可以让机器扫描出成千上万幅图像后,明白它需要重点注意哪里。自动驾驶汽车需要对周围环境具有有效的感知,这对自动驾驶汽车的研发具有重要的意义。
也许这个程序也能用在声音识别上,用于高级的人声识别软件中,或者一些实时翻译的软件。
Hassabis博士说”在工厂,在照顾老人的机器和做家务的机器上,还有很多硬伤,其中之一是当这些机器到了真实世界,他们不得不处理一些意想不到的情况。你不可能对所有可能发生的不测都提前编好代码去应对。“
“在某种意义上,这些机器需要有自主学习和自主适应的功能。“
有些人担心真的造出来比人类强大的机器之后,人类的处境就会变得危险。去年12月霍金教授就曾说过,完善的人工智能技术“会让人类不复存在“。
来源:煎蛋