AlphaGoZero:为什么不懂围棋的虚竹能够破珍珑棋局

原标题:AlphaGoZero:为什么只有虚竹能够破珍珑棋局

“这个珍珑棋局,乃先师所制。先师当年穷三年心血,这才布成,深盼当世棋道中的知心之士,予以破解。在下三十年来苦加钻研,未能参解得透。”

就连段誉、慕容复等棋艺冠绝天下的当世才俊也铩羽而归,最后反而被几乎不懂围棋的虚竹随意一落子破解了:

“珍珑的秘奥正是要白棋先挤死了自己一大块,以后的妙着方能源源而生,这等“挤死自己”的着法,实乃围棋中千古未有之奇变,任你是如何超妙入神的高手,也决不会想到这一条路上去。任何人所想的,总是如何脱困求生,从来没人故意往死路上去想。若不是虚竹闭上眼睛、随手瞎摆而下出这着大笨棋来,只怕再过一千年,这个珍珑也没人能解得开。”

为什么那么多超妙入神的高手不如一个几乎不懂围棋的和尚的随手一子?人类已有的经验往往会成为自身最大的束缚,它会让我们的探索停留在已有的经验范围内,“站在巨人肩膀上”的“巨人”往往也会挡住人类突破创新的视角。10月19日凌晨,谷歌旗下Deepmind团队在《自然》杂志发表的论文《无须人类知识掌握围棋》中提出了新一代的AlphaGoZero,完成了和金庸小说中的虚竹一样的“传奇”:从未看过任何人类棋谱学习围棋知识,却战胜了所有依赖人类经验数据的AlphaGo前辈们。

首先我们用最通俗的方式解释下AlphaGoZero的根本原理:

1、AlphaGoZero还不是“围棋之神”,一直以来计算机下围棋的主要工作就是如何在降低搜索计算量的前提下逼近最优解。围棋作为一种完全信息零和博弈,理论上是可以通过穷举搜索来找到最优解。因为所有可能的下棋路数加起来都是有限的,只是计算量大到几乎不可能完成(很多人把AlphaGoZero比作“围棋之神”其实是不恰当的,真正的“围棋之神”确实存在:即穷举计算后的最优解)。所以一直以来计算机下围棋的重要工作就是如何在降低搜索计算量下逼近这个最优解。这也是为什么我们在各个版本的AlphaGo中都看到了蒙特卡罗树搜索算法的原因,蒙特卡罗树搜索算法实际就是通过概率采样的方式来降低搜索计算量。

2、人类下棋的思考过程实际可以简化为输入当前的棋局信息,输出可以落子的位置和对应赢率的系统,AlphaGoZero就是采用这样一个简洁系统。人下棋其实就是思考这样一个简单的函数,输入是当前局面信息,输出是有哪些位置是可以落子,分别赢率有多大,再从中选择最大赢率的落子。此前版本的AlphaGo是将这两个判断分别用两个深度神经网络系统来实现:

1、决定落子策略的策略网络(通过人类棋谱数据训练);

2、评估每一步赢率的价值网络(通过自我对弈的棋局训练)。

在AlphaGo正式下围棋的时候这两个判断系统与蒙特卡罗树搜索算法结合,从而大幅降低搜索的空间,实现有限计算量下逼近最优解。

图3:AlphaGoZero自我对弈训练的流程:a。程序自己和自己下棋,通过计算获得训练样本数据;b。AlphaGoZero中神经网络的训练,该神经网络将棋盘状态作为输入,输出表示每一走子的概率分布和赢率。

4、AlphaGoZero并非不需要训练数据,而是因为训练数据样本可以根据围棋规则自行计算得到,所以才能完全摆脱人类知识,不停自我迭代训练。神经网络训练的输入数据就是自我对弈的棋局,标注的答案就是自我对弈获胜者的赢率和结合蒙特卡洛树搜索得到的落子概率分布。

图4:自我对弈迭代下,使得对弈数据质量始终不断提升

6、AlphaGoZero的最大的优势是摆脱了人类经验数据的束缚。AlphaGo的自我对弈棋局不会受到人类经验的限制,而此前版本AlphaGo的走子策略网络用人类经验数据训练的,所以很大程度上会在人类经验的样本空间内落子,AlphaGoZero突破了这一局限,这也是为什么在AlphaGoZero的中局搜索空间很大时,会有很多人看不懂的“诡异”走法,因为这已经脱离了人类的经验范围,而有时候这反而是最佳走法。

AlphaGoZero的横空出世有什么意义?

1、对于搜索空间很大,而输出结果不依赖人的感知判断、由客观规则决定的问题,将大大减少训练数据的依赖。实际上在2014年谷歌收购DeepMind前,Deepmind就开发出不需要人类数据训练,自行学会玩街机游戏的人工智能系统震惊于世界,其基本原理其实与如今的AlphaGoZero如出一辙。我们可以看到Deepmind一直以来参与的项目类型都是胜负结果可根据游戏规则计算机自行评估的博弈游戏,无论是街机游戏、围棋还是星际争霸。这种问题的特点在于训练数据可以由计算机根据规则自行判断的游戏结果来获得,而不需要人工标注。AlphaGoZero的成功证明了这一思路是可行的,也有望拓展到其他类似领域。但对于图像、语音识别这类最终结果依赖人类的感知的问题,还是无法代替人类标注的训练数据。

2、有望突破人类经验的局限性,在新材料、新药开发等科研创新领域取得前所未有的突破。Deepmind在论文中也提到其研究成果可能会应用到新材料开发、蛋白质折叠等领域,这些问题有共同特点:以新材料开发、新药物合成等科研领域为例,其符合搜索空间大,结果由客观规则决定的特点,过去的开发可能受到已有的人类经验束缚,如果引入AlphaGoZero,可能会产生意想不到的重大突破。

THE END
1.心法排行榜数据最后更新时间:2024-11-26 00:00:00 排名门派角色名 1峨嵋观澜.ら 2逍遥"季沫、つ 3峨嵋爲卿舞霓裳ヾ 4唐门い凤雏う 5武当半盏忆流年 6唐门.山海′ 7绝情谷鯉辞. 8峨嵋一缕阳光. 9星宿杺禾﹎ 10绝情谷"超开门. 11逍遥ˇ秋水揽星河 12绝情谷"﹎星魂.ゝ https://tl.changyou.com/tlbbrank/4036/top50xinfa.html
2.群豪齐聚擂鼓山破解珍珑棋局,慕容复破棋局走火入魔天龙八部虚竹群豪齐聚擂鼓山破解珍珑棋局,慕容复破棋局走火入魔2024-11-02 00:00:47 琪宝说剧 四川 举报 0 分享至 0:00 / 0:00 速度 洗脑循环 Error: Hls is not supported. 视频加载失败 琪宝说剧 175粉丝 纵有疾风起人生不言弃,看一部好剧,体验不一样的人生方式 03:49 虚竹不愿当灵鹫宫宫主,却跑来https://www.163.com/v/video/VJF12167I.html
3.虚竹临死前才知道,慕容复是装疯,你看他后来改名换姓叫什么这或许是金庸在埋伏笔。一、慕容复的结局 《天龙八部》的江湖中流传着“北乔峰,南慕容”的说法,因此慕容复这个角色在登场之前就让读者拉满了期待值,毕竟那萧峰是如同战神一般的存在,慕容复与他齐名,自然也该是一等一的好手。可慕容复却屡屡受挫,珍珑棋局上就差点走火入魔,少室山大战时又先后被段誉和萧峰https://baijiahao.baidu.com/s?id=1814568731758318762&wfr=spider&for=pc
4.天龙八部珍珑棋局全文阅读舜君小说在线阅读天龙八部珍珑棋局是作者舜君原创作品,科幻灵异,无广告弹窗在线阅读最新章节就在黑道小说。https://www.heidaoxs.com/reads/RKqiKKR/
5.大理天龙八部影视城旅游攻略之珍珑棋局(9/共27页)珍珑棋局介绍:珍珑棋局是金庸先生在其著名长篇武侠小说《天龙八部》中虚拟杜撰的一个棋局,现实生活中的棋谱上并没有记载。珍珑棋局,由逍遥派掌门无崖子所创立,几十年来无人能破。无崖子想借珍珑棋局收一个天资聪颖、英俊潇洒的弟子,以便将毕生功力传给他。小说中,苏星河故意摆出三四十年来未有人破过的珍珑棋局https://www.meet99.com/jingdian-tianlongbabuyingcheng-114301.html
6.重读《天龙八部》珍珑棋局年轻时读到“输赢成败,又争由人算”这一章,还没学会下围棋,只是对虚竹误打误撞解开“珍珑棋局”羡慕不已。如今年过半百,重读到这里,才明白所有的输赢成败,都是吹面而过的清风。 八十年代聂旋风横扫日本棋坛,掀起了国内下围棋的高潮,我也是在这时赶上了时髦,然后便看出了这部书里一个小小的瑕疵。虚竹执白棋自杀https://www.jianshu.com/p/4621c1fbf37b
7.新天龙八部手游珍珑棋局在哪打新天龙八部手游珍珑棋局位置介绍珍珑棋局是游戏内一个经验超多的副本,但是很多小伙伴仍然不清楚新天龙八部手游珍珑棋局在哪打,这会严重拖慢你练级的速度,其实它的位置还是很容易找到的,下面小编就结合图片给大家介绍一下它的位置,萌新玩家看完也能一遍学会,所以赶紧一起来了解一下吧!虽然珍珑棋局本https://www.wandoujia.com/apps/8180952/17239136585043656963.html
8.天龙八部3D珍珑棋局副本进不了解决方案推荐手机游戏游戏攻略《天龙八部3D》珍珑棋局副本是游戏中众多副本中的一个,有玩家表示出现了珍珑棋局副本进不去的情况,那么应该怎么解决这个问题呢? 1、玩家等级达到47级就可以接珍珑棋局主线任务了,珍珑棋局分为单人模式和组队模式,单人模式全天都可以进入,而组队模式只能在20:00-23:59这段时间内进入,进不去的玩家可以先看看自己是https://www.jb51.net/gonglue/244130.html
9.天龙八部2飞龙战天珍珑棋局怎么过天龙八部2飞龙战天珍珑棋局通关天龙八部2飞龙战天这款游戏中「珍珑棋局」是逍遥派掌门人无崖子老先生花了三年时间布的一个局,那么天龙八部2飞龙战天珍珑棋局怎么过呢?下面小编就来将天龙八部2飞龙战天珍珑棋局通关教程分享给大家,一起来往下看看吧。 天龙八部2飞龙战天珍珑棋局通关教程 https://m.liqucn.com/article/287220.wml
10.珍珑棋局小说《天龙八部》中的珍珑棋局 珍珑棋局(2) 珍珑棋局,由逍遥派掌门无崖子所创立,几十年来无人能破。无崖子想借珍珑棋局收一个天资聪颖、英俊潇洒的弟子,以便将毕生功力传给他。后珍珑棋局不料被丑和尚虚竹误打误撞所破。 快速导航 词条图册 名称 https://baike.sogou.com/v64724676.htm
11.天龙八部中,段延庆为何指点虚竹破解珍珑棋局?《天龙八部中, 段延庆为何指点虚竹破解珍珑棋局?_手机搜狐》剧情简介:那天她一直在等一个电话等邵一辰的电话她决定只要邵一辰低头她一定和他和好如初一定加倍补偿他但没用的杀意一点一点剥离金乌的意识留下它残存的太阳之力天龙八部中, 段延庆为何指点虚竹破解珍珑棋局?_手机搜狐都怪我岳胜http://www.weili.com.cn/idkuogiphz=.txt20240810yf332dazczy3
12.珍珑棋局上在鸠摩智之后出场的人物是谁–快看漫画问答《天龙八部》珍珑棋局的起源 珍珑棋局是逍遥派掌门人无崖子老先生花了整整三年的时间摆出一个棋局,逍遥派的无崖子老先生本人所学不仅仅是武功,无崖子是一个聪明绝顶的人,琴棋书画无所不通,无所不精。并命弟子苏星河当擂主,邀请天下英雄来破解“珍珑棋局”。 https://m.kuaikanmanhua.com/qa/21245/
13.金庸天龙八部里有个玲珑棋局,原文是这么讲的“这个珍珑变幻百端,因金庸天龙八部里有个玲珑棋局,原文是这么讲的“这个珍珑变幻百端,因人而施,爱财者因贪失误,易怒者由愤坏事。段誉之败,在于爱心太重,不肯弃子;慕容复之失,由于执着权势,勇于弃子,却说什么也不肯失势。段延庆生平第一恨事,乃是残废之后,不得不抛开本门正宗武功,改习旁门左道的邪术,一到全神贯注之时,外魔入侵https://xueqiu.com/2641119458/131349657
14.大理的天龙八部影视城怎么样,天龙八部影视城好玩吗马蜂窝西夏王宫,俗称皇宫,位于大理天龙八部影视城南端,这里还原了西夏王宫的富丽堂皇与恢宏大气,以及女真部落骑马射箭的场景,犹记得虚竹和尚在西夏王宫比武招亲,到了现场可以重温了! 天龙八部影视城好玩景点:珍珑棋局 影视城中,珍珑棋局不得不玩。《天龙八部》中的虚竹大破珍珑棋局一举出名,影视城中的珍珑棋局则气势恢宏,https://m.mafengwo.cn/travel-news/1432762.html
15.北京出发大理城外苍山之巅·珍珑棋局北京出发|大理城外 苍山之巅·珍珑棋局 珍珑棋局是根据当代著名武侠作家金庸先生,在《天龙八部》中所描述,大理皇太子段延庆与黄眉僧人对弈的棋盘,如今在原址上重新修建而成。原来围棋改为象棋,棋盘长21米,宽19米,总面积400平方米,棋盘红、白相间。 从苍山门口自己爬到珍珑棋局的话,大概需要1.5https://m.dianping.com/ugcdetail/263596899?sceneType=0&bizType=29&msource=baiduappugc
16.天龙八部3[交流]资料片更新详细内容0.22.0320经验心得11、珍珑棋局活动增加时间选择 为了满足广大天龙迷刷棋局的强烈愿望,特将珍珑棋局活动增加了其它的时间段选择,具体时间为每天中午的11:30—14:30。大家可以自由选择时间参加每天一次的棋局活动,别忘了茶余饭后棋局在等你哦。 同时为了避免每日棋局活动的拥挤,在大理(274,95)处增加了一个棋局入口NPC,并且增加了相关https://tl.52pk.com/shtml/177764.shtml