/ 中存储网

机器人破解围棋:首胜欧洲冠军

2016-01-29 00:00:00 来源:辽沈晚报


 

1月28日上午消息,谷歌今日召开全球电话会议,旗下Deep MInd创始人戴密斯·哈萨比斯(Demis Hassabis)宣布了谷歌在人工智能领域的重要进展:开发出一款能够在围棋中击败职业选手的程序——AlphaGo,后者能够通过机器学习的方式掌握比赛技巧。

人工智能挑战围棋有多难?

计算机和人类竞赛在棋类比赛中已不罕见,在三子棋、跳棋和国际象棋等棋类上,计算机都先后完成了对人类的挑战。但对拥有2500多年历史的围棋而言,计算机在此之前从未战胜过人类。围棋看起来棋盘简单、规则不难,纵横各19条等距离、垂直交叉的平行线,共构成19×19(361)个交叉点。比赛双方交替落子,目的是在棋盘上占据尽可能大的空间。

在极简主义的游戏表象之下,围棋具有令人难以置信的深度和微妙之处。当棋盘为空时,先手拥有361个可选方案。在游戏进行当中,它拥有远比国际象棋更多的选择空间,这也是为什么人工智能、机器学习的研发者们始终希望在此取得突破的原因。

就机器学习的角度而言,围棋的计算最大有3361种局面,大致的体量是10170,而已经观测到的宇宙中,原子的数量才1080。国际象棋最大只有2155种局面,称为香农数,大致是1047。

“机器学习”预测人类行为

传统的人工智能方法是将所有可能的走法构建成一棵搜索树,但这种方法对围棋并不适用。此次谷歌推出的lphaGo,将高级搜索树与深度神经网络结合在一起。这些神经网络通过12个处理层传递对棋盘的描述,处理层则包含数百万个类似于神经的连接点。

其中一个神经网络“决策网络”(policy network)负责选择下一步走法,另一个神经网络“值网络”(value network)则预测比赛胜利方。谷歌方面用人类围棋高手的三千万步围棋走法训练神经网络,与此同时,AlphaGo也自行研究新战略,在它的神经网络之间运行了数千局围棋,利用反复试验调整连接点,这个流程也称为巩固学习(reinforcementlearning)。通过广泛使用Google云平台,完成了大量研究工作。

征服围棋对于谷歌来说有重要意义。AlphaGo不仅是遵循人工规则的“专家”系统,它还通过“机器学习”自行掌握如何赢得围棋比赛。谷歌方面希望运用这些技术解决现实社会最严峻、最紧迫的问题——从气候建模到复杂的灾难分析。

在具体的机器训练上,决策网络的方式是输入人类围棋专家的比赛,到系统可以预测57%人类行动为止,此前最好成绩是44%。此后AlphaGo通过在神经网络内部进行比赛的方式(可以简单理解成和自己下棋),开始学习自主探索新的围棋策略。目前AlphaGo的决策网络可以击败大多数具有庞大搜寻树的最先进的围棋程序。

值网络也是通过自己和自己下棋的方式来训练。目前值网络可以评估每一步棋能够有多大胜算。这在此前被认为是不可能的。

AlphaGo战绩惊人 曾胜500场

实际上,目前AlphaGo已经成为最优秀的人工智能围棋程序。在与其他程序的对弈中,AlphaGo用一台机器就取得了500场的胜利,甚至有过让对手4手后获胜的纪录。去年10月5日-10月9日,谷歌安排AlphaGo与欧洲围棋冠军Fan Hui(樊麾:法国国家围棋队总教练)闭门比赛,AlphaGo以5:0取胜。

公开的比赛将在今年三月举行,AlphaGo将在韩国首尔与韩国围棋选手李世石九段一决高下,李世石是近10年来获得世界第一头衔最多的棋手,谷歌为此提供了100万美元作为奖金。李世石表示很期待此次对决,并且有信心获得胜利。

此外,AlphaGo的发布,也是Deep MInd在2014年1月被谷歌收购以来首次发声。在被收购之前,这家位于伦敦的人工智能领域的公司还获得了特斯拉和SpaceX创始人马斯克的投资。

人机对弈谁将胜?

值得一提的是,上一次著名的人机对弈要追溯到1997年。当时IBM公司研发的超级计算机“深蓝”战胜了国际象棋冠军卡斯巴罗夫。不过国际象棋的算法要比围棋简单得多。国际象棋中取胜只需“杀死”国王,而围棋中则用数子或比目的方法计算胜负,并不是简单地杀死对方棋子。此前,“深蓝”计算机的设计人2007年发表文章指出,他相信十年内能有超级电脑在围棋上战胜人类。

该项目并未给IBM带来可以销售的产品,但却让我们意识到:基础科学研究所面临的巨大挑战是值得我们去迎接的,虽然企业在这方面的收益还无法量化。

随着顶级科技公司争相在产品中融入智能技术,谷歌并不是唯一一家研究围棋AI的公司,Facebook对围棋人工智能的研究整合此前也亮相最新的计算技术:深卷积神经网络(deep convolutional neural networks)和蒙特卡洛树搜索(Monte Carlo tree search),前者利用类似于大脑的算法来学习和识别棋盘上各种模式的重要性,而后者相当于一种超前思维,用于计算详细的战略步骤。

Facebook和谷歌在围棋人工智能方面的研究具有极大的代表意义。与国际象棋相比,围棋更具深度。要让计算机掌握相关技巧,需要更多类似于人类的模式识别和直觉判断技巧,计算机象棋软件越来越优秀,已将揭开了这项游戏的神秘面纱;相比之下,围棋目前更加神秘。但将来,围棋的神秘色彩也可能不复存在。

电脑与人脑的大战迎来“关键一步”

AlphaGo这个名称由两部分组成,Alpha对应希腊语的第一个字母,有“首要、关键”的意思;Go来自日语对围棋的称呼,在英语中也有“行走、前进”的意思。因此,AlphaGo也许可以意译为 “关键一步”。

相关论文中介绍说AlphaGo的最大特点并不是计算速度,而是算法的优化。它通过名为“价值网络”的算法来评估棋盘上的各个位置,再通过名为“策略网络”的算法来选择在哪落子,从而取得了高度优化的围棋策略。论文说,与当年的“深蓝”相比,AlphaGo所评估的棋子位置只有数千分之一。这说明它已经减少大量的无用计算,变得更加智能。

在人工智能领域,还有另一个著名的关卡是“图灵测试”。这种由著名计算机科学家图灵提出的测试,是让电脑模仿人类与人类裁判“对话”,如果成功诱使人类裁判认为与之对话的是人,则通过测试。 2014年,在英国皇家学会于伦敦举行的 “图灵测试”竞赛上,一台名为“尤金·古兹曼”的电脑通过测试。

电脑在与人脑的大战中不断过关斩将,但它们目前还面临一个限制,那就是还不会将其智能“通用化”。如果电脑能够突破这个限制,无疑会将人工智能带入一个新的境界。

在推动人工智能发展的过程中,人类如何在伦理上 “控制”电脑也是一个挑战。如一些科幻电影描述的那样,许多人担心人工智能的发展可能带来灾难,著名科学家霍金就曾表示人工智能可能会导致人类灭绝。因此,科学家也需要注意让人工智能不会迈出真正挑战人类的“关键一步”。

网上晒自拍影响恋情

如今有不少人喜欢在社交媒体上晒自拍照。不过你可曾想到,这可能会让你的恋情告急?美国佛罗里达州立大学一项最新研究显示,越是爱在网上晒自拍,你越可能在现实中与伴侣发生矛盾冲突。

研究人员围绕图片分享网站Insta-gram展开研究,在线调查了420名Insta-gram用户,受访者年龄在18到62岁之间。结果发现,用户上传自拍照与他们的个人整体形象满意度存在关联,那些觉得自己好看的人更爱晒自拍,但同时晒自拍行为又导致与伴侣的争吵增加。

研究人员在《网络心理学、行为与社交网络》期刊发表文章说,毫无疑问,晒自拍会引发嫉妒和争吵,进而引发身心不忠、分手或离婚。建议大家少晒自拍,尤其是那些容易引起误会的照片。 据新华社

空气污染致早产增加

孕妈妈们注意了,美国有研究显示,空气质量差会令早产几率增加。辛辛那提大学与辛辛那提儿童医院医疗中心研究人员研究了2007年至2010年俄亥俄州的人口出生记录。这期间,当地共出生了22.5万名婴儿,其中有1.9万名属于早产。在医学上,母亲怀孕未满37周生产称为早产。

研究人员把早产率与美国环保署空气质量监测网络测试出的PM2.5水平联系起来后发现,91%的早产发生在“非常靠近市中心的地方”,那里的细颗粒物水平较高。测算显示,生活在细颗粒物水平高地区的妇女,早产几率高近两成。怀孕后期接触高浓度细颗粒物尤其容易导致早产。 据新华社

上社交网站会失眠?

美国一项研究显示,经常上社交网站会影响睡眠。匹兹堡大学医学院研究人员2014年调查了1788名19岁至32岁年轻人数据,了解他们每天在社交网站上花费的时间以及睡眠状况。研究这个年龄段人群是因为他们是与社交网络一起成长的第一代。调查显示,这些人平均每天在社交网站上消磨61分钟,其中30%睡眠不正常。

调查还显示,经常上社交网站的人睡眠不正常的几率是不经常上社交网站者的3倍,每天上社交网站总计时间最多的人睡眠不正常几率是总计时间最少的人的2倍。

调查报告作者杰茜卡·C·利文森说:“这可能显示,访问社交网站的频率比总计时间更可能预示睡眠障碍。”研究人员认为,访问社交网站与睡眠不正常之间的关联还可能包括睡不着觉时会上社交网站,睡不着觉与上社交网站之间可能存在恶性循环。