AlphaGoZero:为什么不懂围棋的虚竹能够破珍珑棋局

原标题:AlphaGoZero:为什么只有虚竹能够破珍珑棋局

“这个珍珑棋局,乃先师所制。先师当年穷三年心血,这才布成,深盼当世棋道中的知心之士,予以破解。在下三十年来苦加钻研,未能参解得透。”

就连段誉、慕容复等棋艺冠绝天下的当世才俊也铩羽而归,最后反而被几乎不懂围棋的虚竹随意一落子破解了:

“珍珑的秘奥正是要白棋先挤死了自己一大块,以后的妙着方能源源而生,这等“挤死自己”的着法,实乃围棋中千古未有之奇变,任你是如何超妙入神的高手,也决不会想到这一条路上去。任何人所想的,总是如何脱困求生,从来没人故意往死路上去想。若不是虚竹闭上眼睛、随手瞎摆而下出这着大笨棋来,只怕再过一千年,这个珍珑也没人能解得开。”

为什么那么多超妙入神的高手不如一个几乎不懂围棋的和尚的随手一子?人类已有的经验往往会成为自身最大的束缚,它会让我们的探索停留在已有的经验范围内,“站在巨人肩膀上”的“巨人”往往也会挡住人类突破创新的视角。10月19日凌晨,谷歌旗下Deepmind团队在《自然》杂志发表的论文《无须人类知识掌握围棋》中提出了新一代的AlphaGoZero,完成了和金庸小说中的虚竹一样的“传奇”:从未看过任何人类棋谱学习围棋知识,却战胜了所有依赖人类经验数据的AlphaGo前辈们。

首先我们用最通俗的方式解释下AlphaGoZero的根本原理:

1、AlphaGoZero还不是“围棋之神”,一直以来计算机下围棋的主要工作就是如何在降低搜索计算量的前提下逼近最优解。围棋作为一种完全信息零和博弈,理论上是可以通过穷举搜索来找到最优解。因为所有可能的下棋路数加起来都是有限的,只是计算量大到几乎不可能完成(很多人把AlphaGoZero比作“围棋之神”其实是不恰当的,真正的“围棋之神”确实存在:即穷举计算后的最优解)。所以一直以来计算机下围棋的重要工作就是如何在降低搜索计算量下逼近这个最优解。这也是为什么我们在各个版本的AlphaGo中都看到了蒙特卡罗树搜索算法的原因,蒙特卡罗树搜索算法实际就是通过概率采样的方式来降低搜索计算量。

2、人类下棋的思考过程实际可以简化为输入当前的棋局信息,输出可以落子的位置和对应赢率的系统,AlphaGoZero就是采用这样一个简洁系统。人下棋其实就是思考这样一个简单的函数,输入是当前局面信息,输出是有哪些位置是可以落子,分别赢率有多大,再从中选择最大赢率的落子。此前版本的AlphaGo是将这两个判断分别用两个深度神经网络系统来实现:

1、决定落子策略的策略网络(通过人类棋谱数据训练);

2、评估每一步赢率的价值网络(通过自我对弈的棋局训练)。

在AlphaGo正式下围棋的时候这两个判断系统与蒙特卡罗树搜索算法结合,从而大幅降低搜索的空间,实现有限计算量下逼近最优解。

图3:AlphaGoZero自我对弈训练的流程:a。程序自己和自己下棋,通过计算获得训练样本数据;b。AlphaGoZero中神经网络的训练,该神经网络将棋盘状态作为输入,输出表示每一走子的概率分布和赢率。

4、AlphaGoZero并非不需要训练数据,而是因为训练数据样本可以根据围棋规则自行计算得到,所以才能完全摆脱人类知识,不停自我迭代训练。神经网络训练的输入数据就是自我对弈的棋局,标注的答案就是自我对弈获胜者的赢率和结合蒙特卡洛树搜索得到的落子概率分布。

图4:自我对弈迭代下,使得对弈数据质量始终不断提升

6、AlphaGoZero的最大的优势是摆脱了人类经验数据的束缚。AlphaGo的自我对弈棋局不会受到人类经验的限制,而此前版本AlphaGo的走子策略网络用人类经验数据训练的,所以很大程度上会在人类经验的样本空间内落子,AlphaGoZero突破了这一局限,这也是为什么在AlphaGoZero的中局搜索空间很大时,会有很多人看不懂的“诡异”走法,因为这已经脱离了人类的经验范围,而有时候这反而是最佳走法。

AlphaGoZero的横空出世有什么意义?

1、对于搜索空间很大,而输出结果不依赖人的感知判断、由客观规则决定的问题,将大大减少训练数据的依赖。实际上在2014年谷歌收购DeepMind前,Deepmind就开发出不需要人类数据训练,自行学会玩街机游戏的人工智能系统震惊于世界,其基本原理其实与如今的AlphaGoZero如出一辙。我们可以看到Deepmind一直以来参与的项目类型都是胜负结果可根据游戏规则计算机自行评估的博弈游戏,无论是街机游戏、围棋还是星际争霸。这种问题的特点在于训练数据可以由计算机根据规则自行判断的游戏结果来获得,而不需要人工标注。AlphaGoZero的成功证明了这一思路是可行的,也有望拓展到其他类似领域。但对于图像、语音识别这类最终结果依赖人类的感知的问题,还是无法代替人类标注的训练数据。

2、有望突破人类经验的局限性,在新材料、新药开发等科研创新领域取得前所未有的突破。Deepmind在论文中也提到其研究成果可能会应用到新材料开发、蛋白质折叠等领域,这些问题有共同特点:以新材料开发、新药物合成等科研领域为例,其符合搜索空间大,结果由客观规则决定的特点,过去的开发可能受到已有的人类经验束缚,如果引入AlphaGoZero,可能会产生意想不到的重大突破。

THE END
1.橘中秘梅花谱等8大古谱详解!哔哩哔哩桔谱保持原有风格,体会中残局造杀思路及残局杀法;对梅谱开局体系进行拓展延伸,不仅加入《无双品梅花谱》和《反梅花谱》的精华棋谱,而且也按现代弈理剖析了梅花体系炮方与马方的攻防变化。由此可见,《古谱全解》是系统全面、重点突出、与时俱进的象棋古谱百科全书,我们就跟着《古谱全解》来窥探象棋古谱之全貌,领悟https://www.bilibili.com/cheese/play/ss7648?search_query=%E7%A7%988
2.中村茂连珠名局集本文是中山智晴的自战记 第九十九局 2020年1月 第15期珠王战 第5局 先黑:中山智晴 八段 (53分分)4白:中村茂 名人(1小时) 用时:各50分钟 + 菲舍尔加秒制 30秒 结果:黑49 白投了 (5A=6,7,12,13,14,26,32)动态棋谱点这里连珠的比赛,通常多盘对局同时开始,其他的对局也可以远远地观战。… https://www.zhihu.com/column/c_1479603506558046208
3.这就是江湖珍珑棋局攻略相关内容游戏问答在游戏中,玩家需要掌握一定的棋谱和技巧,才能够取得胜利。下面是江湖珍珑棋局攻略的相关内容,希望对https://www.9game.cn/wenda/67150.html
4.珍珑棋局根据金庸先生的著名长篇武侠小说《天龙八部》中的描述,苏星河故意摆出三四十年来未有人破过的珍珑棋局用来引出杀师傅的仇人,各路高手前来挑战皆败,惟独不懂棋的虚竹胡乱投了一子破了棋局。这个棋局是金庸先生编造的,棋谱上并没有。 后有人据古代棋书《发阳论》经过几夜商讨攻破了珍珑棋局的摆法,局中“金鸡独立https://baike.sogou.com/v64724676.htm
5.大理天龙八部影视城旅游攻略之珍珑棋局(9/共27页)珍珑棋局介绍:珍珑棋局是金庸先生在其著名长篇武侠小说《天龙八部》中虚拟杜撰的一个棋局,现实生活中的棋谱上并没有记载。珍珑棋局,由逍遥派掌门无崖子所创立,几十年来无人能破。无崖子想借珍珑棋局收一个天资聪颖、英俊潇洒的弟子,以便将毕生功力传给他。小说中,苏星河故意摆出三四十年来未有人破过的珍珑棋局https://www.meet99.com/jingdian-tianlongbabuyingcheng-114301.html
6.金庸杜撰的珍珑棋局到底有什么玄机据说:这个棋局是金庸先生杜撰的,棋谱上并没有。姑且勿论,珍珑棋局是否真实存在;抑或,在历史发展的过程中失传已久。至少,大家记住了“珍珑棋局”;以及,武侠小说中的精彩情节。在此之后,很多影视作品、文学书籍中也提及这四个字。珍珑棋局不似昙花一现,反倒成为一个文化符号。 https://www.douban.com/note/567789723/
7.天龙部手游:珍珑棋局为核心的高效刷经验升级攻略导语:天龙部手游中,珍珑棋局不仅是个充满挑战的关卡,更是玩家们磨砺技术积累经验的绝佳场所。本攻略将围绕珍珑棋局,为各位玩家提供套高效刷经验升级的方法。让我们共同探索,以策略与智慧,在棋局中赢取丰厚的经验与奖励! 珍珑棋局概述 1. 珍珑棋局介绍 http://www.6000zz.cn/zzgl/22360.html
8.新笑傲江湖——日月凌空线剧情攻略金书红颜本帖最后由 流星追影 于 2013-10-11 11:03 编辑 前言:1,由于是最近连续夜班借用上班时间赶出来的https://game.ali213.net/forum.php?mod=viewthread&tid=5276277&mobile=1
9.围棋中的“珍珑棋局”真的有吗?又是怎么样布局的?现实生活中并不存在“珍珑棋局”,这只是金庸为武侠小说《天龙八部》构造的棋局。在金庸的小说中,有许多关于围棋的精彩描写,无形中推广了围棋。围棋国手陈祖德曾说,金庸的水平还不错,一般让金庸四子与之对弈。对于金庸小说里关于珍珑棋局的描写,陈祖德不仅大赞其想象力,甚至还亲自摆过。“我也试着https://zhidao.baidu.com/question/576254758.html
10.珍珑谱风归云隐橙光作品《珍珑谱》这款橙光作品的制作者是 风归云隐 ,使用《橙光 制作工具》制作。作品简介:月圆之夜,子时。宁如曦和小师弟孤身涉险,欲摧毁极乐赌坊所举办的嗜血“子夜之宴”,当巨轮被炸毁,这一切的幕后真凶揭开面纱之时,她心中的信念支柱却也随之轰然倒塌。这仅仅是一个https://www.66rpg.com/game/1451535
11.棋局造句24、在苍山,吴清源高兴地品尝了三道茶,坚持坐索道观赏了珍珑棋局,亲自在清碧溪旁的名人林种下了樱花树。 25、当棋局中有特定的劫杀时,我们引入相关的视温差法作为一种分析打劫的新方法。 26、刘旭结合眼前棋局,参照脑中棋谱,很快便把崔老的包围打破,两人进入激烈的绞杀战中。 https://www.hao86.com/zaoju_view_9a836d43ac9a836d/
12.围棋书籍大全上千本电子书汇集–天祺围棋陈子仙百局棋谱.pdf 陈子仙百局棋谱.pdg 吃子手段 (围棋技术讲座小丛书)_刘晓君译.pdf (2009-02-23更新) 出奇制胜的妙手——围棋实战死活192题_大平修局中珍珑 (东轩书趣文丛)_白衣 风翔.pdf 局中珍珑 (东轩书趣文丛)_白衣 风翔.pdg 飓风之翼——曹薰铉中盘攻击法_张大勇.pdf (2009-01-07更新)https://www.tianqiweiqi.com/weiqi-pdf-ebook.html