博弈之SG函数(详解为什么异或可以得出结果)_sg的异或有什么用_hncu__lz的博客-程序员秘密

技术标签: 博弈  


给定一个 有向无环图和一个起始顶点上的一枚棋子,两名选手交替的将这枚棋子沿有向边进行移动,无法移 动者判负。事实上,这个游戏可以认为是所有Impartial Combinatorial Games的抽象模型。
也就是说,任何一个ICG都可以通过把每个局面看成一个顶点,对每个局面和它的子局面连一条有向边来抽象成这个“ 有向图游戏”。下 面我们就在 有向无环图的顶点上定义Sprague-Grundy函数。首先定义mex(minimal excludant)运算,这是施加于一个集合的运算,表示最小的不属于这个集合的 非负整数。例如mex{0,1,2,4}=3、mex{2,3,5}=0、mex{}=0。
对于一个给定的有向无环图,定义关于图的每个顶点的 Sprague-Grundy函数g如下:g(x)=mex{ g(y) | y是x的后继 }。
来看一下SG函数的性质。首先,所有的terminal position所对应的顶点,也就是没有出边的顶点,其SG值为0,因为它的后继集合是 空集。然后对于一个g(x)=0的顶点x,它的所有前驱y都满足 g(y)!=0。对于一个g(x)!=0的顶点,必定存在一个后继y满足g(y)=0。
以上这三句话表明,顶点x所代表的postion是P-position当且仅当g(x)=0(跟P-positioin/N-position的 定义的那三句话是完全对应的)。我们通过计算 有向无环图的每个顶点的SG值,就可以对每种局面找到必胜策略了。
例如:取石子问题,有1堆n个的石子,每次只能取{1,3,4}个石子,先取完石子者胜利,那么各个数的SG值为多少?

sg[0]=0,f[]={1,3,4},

x=1时,可以取走1-f{1}个石子,剩余{0}个,mex{sg[0]}={0},故sg[1]=1;  //表示为1时可以让对手只能选择sg值为0,就必赢;

x=2时,可以取走2-f{1}个石子,剩余{1}个,mex{sg[1]}={1},故sg[2]=0;//表示只能让对手sg为1,然后让对手下的话,由于对手sg值为1,所以可以让先手的人到sg值为0,必输;

x=3时,可以取走3-f{1,3}个石子,剩余{2,0}个,mex{sg[2],sg[0]}={0,0},故sg[3]=1;  //可以让对手sg为0;必赢;

x=4时,可以取走4-f{1,3,4}个石子,剩余{3,1,0}个,mex{sg[3],sg[1],sg[0]}={1,1,0},故sg[4]=2;

x=5时,可以取走5-f{1,3,4}个石子,剩余{4,2,1}个,mex{sg[4],sg[2],sg[1]}={2,0,1},故sg[5]=3;

f[]需要从小到大排序,这个模版f是从1开始的。hash数组大小跟f[]大小差不多,f

1.可选步数为1~m的连续整数,直接取模即可,SG(x) = x % (m+1);

2.可选步数为任意步,SG(x) = x;

3.可选步数为一系列不连续的数,用GetSG()计算

我们可以根据sg[n]是否为0判断是否必胜,我们称sg值为0为必输态;


但SG函数的用途远没有这样简单,如果将有 向图游戏变复杂一点,比如说, 有向图上并不是只有一枚棋子,而是有n枚棋子,每次可以任选一颗进行移动,这时,怎样找到必胜策略呢?
让我们再来考虑一下顶点的SG值的意义。当g(x)=k时,表明对于任意一个0<=i<k,都存在x的一个后继y满足g(y)=i。也 就是说,当某枚棋子的SG值是k时,我们可以把它变成0、变成1、……、变成k-1,但绝对不能保持k不变。不知道你能不能根据这个联想到Nim游戏, Nim游戏的规则就是:每次选择一堆数量为k的石子,可以把它变成0、变成1、……、变成k-1,但绝对不能保持k不变。 这表明,如果将n枚棋子所在的顶 点的SG值看作n堆相应数量的石子 ,那么这个Nim游戏的每个必胜策略都对应于原来这n枚棋子的必胜策略!
对于n个棋子,设它们对应的顶点的SG值分别为(a1,a2,…,an),再设局面(a1,a2,…,an)时的Nim游戏的一种必胜策略是把ai 变成k,那么原游戏的一种必胜策略就是把第i枚棋子移动到一个SG值为k的顶点。 对于某个局面(a1,a2,...,an),若a1^a2^...^an<>0,一定存在某个合法的移动,将ai改变成ai'后满足a1^a2^...^ai'^...^an=0。不妨设a1^a2^...^an=k,则一定存在某个ai,它的二进制表示在k的最高位上是1(否则k的最高位那个1是怎么得到的)。这时ai^k<ai一定成立。则我们可以将ai改变成ai'=ai^k,此时a1^a2^...^ai'^...^an=a1^a2^...^an^k=0。
其实我们还是只要证明这种多棋子的 有向图游戏的局面是P-position当且仅当所有棋子所在的位置的SG函数的 异或为0,
刚才,我为了使问题看上去更容易一些,认为n枚棋子是在一个有向图上移动。但如果不是在一个有向图上,而是每个棋子在一个有向图上,每次可以任选一个棋子(也就是任选一个有向图)进行移动,这样也不会给结论带来任何变化。
所以我们可以定义有向图游戏的和(Sum of Graph Games):设G1、G2、……、Gn是n个有向图游戏,定义游戏G是G1、G2、……、Gn的和(Sum),游戏G的移动规则是:任选一个子游戏Gi 并移动上面的棋子。Sprague-Grundy Theorem就是:g(G)=g(G1)^g(G2)^…^g(Gn)。也就是说,游戏的和的SG 函数值是它的所有子游戏的SG函数值的 异或
为什么sg异或结果为0必输?以下是自己体会的一种方法判断;
我们先假设只有两堆,sg值分别为5,9,之前我们讲把sg值可以简化看做相应数量的石子,我们用二进制来表示;
【5】2   : 0 1 0 1
【9】2: 1 0 0 1   
5^9=1 1 0 0;  如果先手把1 0 0 1 变成0 1 0 1,也就是取走4颗石子,于是两堆石子数量变得一样了;然后对手怎么操作 于是先手跟着操作
那么肯定是先手取玩最后的,这个列子说明,只要异或不为0,先手只要把异或结果变为0然后就跟着对手下,肯定必应,当然,如果异或原本是0,对手跟着先手下,那么先手必输;
然后我们考虑n堆的异或,如果异或结果为0,表示二进制状态下所有堆数量每个位的1数量相等,先手操作,肯定改变其中某一堆的1的变化使得数量变少, 对手只需跟着改变其它堆与其对应的1的位,使其以后异或还是为0,先手必输;   异或结果不为0,先手只需把异或结果变为0就可以了,至于为什么肯定使得异或结果变为0,之前已经证明;
再考虑在本文一开头的一句话:任何一个ICG都可以抽象成一个 有向图游戏。所以“SG函数”和“游戏的和”的概念就不是局限于有向图游戏。我们给每 个ICG的每个position定义SG值,也可以定义n个ICG的和。所以说当我们面对由n个游戏组合成的一个游戏时,只需对于每个游戏找出求它的每个 局面的SG值的方法,就可以把这些SG值全部看成Nim的石子堆,然后依照找Nim的必胜策略的方法来找这个游戏的必胜策略了!
回到本文开头的问题。有n堆石子,每次可以从第1堆石子里取1颗、2颗或3颗,可以从第2堆石子里取奇数颗,可以从第3堆及以后石子里取任意颗…… 我们可以把它看作3个子游戏,第1个子游戏只有一堆石子,每次可以取1、2、3颗,很容易看出x颗石子的局面的SG值是x%4。第2个子游戏也是只有一堆 石子,每次可以取奇数颗,经过简单的画图可以知道这个游戏有x颗石子时的SG值是x%2。第3个游戏有n-2堆石子,就是一个 Nim游戏。对于原游戏的每 个局面,把三个子游戏的SG值 异或一下就得到了整个游戏的SG值,然后就可以根据这个SG值判断是否有必胜策略以及做出决策了。其实看作3个子游戏还是保 守了些,干脆看作n个子游戏,其中第1、2个子游戏如上所述,第3个及以后的子游戏都是“1堆石子,每次取几颗都可以”,称为“任取石子游戏”,这个超简 单的游戏有x颗石子的SG值显然就是x。其实,n堆石子的 Nim游戏本身不就是n个“任取石子游戏”的和吗?
所以,对于我们来说,SG函数与“游戏的和”的概念不是让我们去组合、制造稀奇古怪的游戏,而是把遇到的看上去有些复杂的游戏试图分成若干个子游 戏,对于每个比原游戏简化很多的子游戏找出它的SG函数,然后全部异或起来就得到了原游戏的SG函数,就可以解决原游戏了。

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/hndu__lz/article/details/61925818

智能推荐

rk3288_lubuntu_img制作步骤_rk lubuntu_jiangdou88的博客-程序员秘密

1#刷Firefly-RK3288_Android4.4_201412290906.img启动后刷linux-boot-miniroot.img 写到 recovery 分区,misc.img 写到 misc 分区。2#建立TFa,插TF到rk3288,  fdisk  -lb,fdisk /dev/mmcblk1       d (选择d,w删除所有分区)       选

使用pip安装模块时提示: No module named pip_奔跑着的孩子的博客-程序员秘密

系统输入cmd:windows 解决方法: python -m ensurepip升级pip版本:&gt;&gt;&gt; pip install --upgrade pip也许是pip3,pip3.7,到安装路径下查看:D:\Programs\Python\Python37\Scriptslinux解决方法:python -m ensurepipsudo easy_i...

textview是否超过一行_Android TextView 判断文字内容是否超出显示省略号_邢二狗的博客-程序员秘密

TextView 判断文字内容是否超出显示省略号最近在做一个类似于QQ空间的一个社交圈的模块的开发。有一个需求是当用户发表的内容超出4行时,显示一个按钮,点击按钮展示全文。我还真没有发现TextView有获取文本内容有没有显示省略号这个方法。没办法,只能自己想办法了。想法和思路textview既然自己会显示省略号,内部肯定有算法判断了内容是否超出最大行数的,我是不是可以找到这个方法,或者找到这个方...

c/c++ 获取当前程序(EXE)所在的路径_c++获取exe所在文件夹路径_沙漏99的博客-程序员秘密

一、1.只获得路径字串不包含文件名TCHAR szFilePath[MAX_PATH + 1]={0};GetModuleFileName(NULL, szFilePath, MAX_PATH);(_tcsrchr(szFilePath, _T('\\')))[1] = 0; // 删除文件名,只获得路径字串CString str_url = szFilePath; 

算法刷题系列(三)蓝桥杯python基础练习4_孑渡的博客-程序员秘密

- 十六进制转十进制资源限制时间限制:1.0s 内存限制:512.0MB问题描述从键盘输入一个不超过8位的正的十六进制数字符串,将它转换为正的十进制数后输出。注:十六进制数中的10~15分别用大写的英文字母A、B、C、D、E、F表示。样例输入FFFF样例输出65535解答程序# 十六进制转十进制temp_dict = {'0':0, '1':1, '2':2, '3':3, '4':4, '5':5, '6':6, '7':7, '8':8, '9':9, 'A':10,

计算机网络基础知识 - 物理层_计算机网络物理层的作用_殊彦_sy的博客-程序员秘密

本章主要介绍计算机网络的基础知识和物理层知识。

随便推点

关于left join 的连接条件和过滤条件的关系_买了否冷的博客-程序员秘密

参考文章:https://blog.csdn.net/weixin_39428938/article/details/77944939left join的困惑:一旦加上where条件,则显示的结果等于inner join将where 换成 and 用where 是先连接然后再筛选 用and 是先筛选再连接过滤条件放在:where后面:是先连接然生成临时查询结果,然后再筛选...

开源虚拟化平台解决方案oVirt 4.0尝鲜准备_virt4.0_DexterLien的博客-程序员秘密

最近准备给运行了3年多的RHEL更换存储设备,突然意识到RHEVM那台服务器貌似都没有可替代的容灾方案,毕竟当时就只买了一年的RHN订阅,如果哪天RHEVM服务器突然挂掉的话,还真就懵逼了,各种rpm包都得用yum安装,没有订阅就没法重新部署环境了,不能想象啊~赶紧找了下资料,果然不出所料,只要是红帽有的东西,都会有相应开源的项目可以替代,目前找到的方案是使用CentOS替换RHEL,oVirt替...

javascript 查看变量类型_sayyy的博客-程序员秘密

console.log(Object.prototype.toString.call(1));console.log(Object.prototype.toString.call(3.14));console.log(Object.prototype.toString.call('a'));console.log(Object.prototype.toString.call(true));console.log(Object.prototype.toString.call([1,2,3]));co

【经验】 - \r,\n,\r\n的区别_I18N_R的博客-程序员秘密

回车、换行的区别  他们间的区别其实是个回车换行的问题先来段历史回车”(Carriage Return)和“换行”(Line Feed)这两个概念的来历和区别。符号        ASCII码        意义\n               10          换行\r                13            回车CR在计算机还没有出现之前,有...

CDN实现方案如何选择: squid Varnish Nginx_dengyiyu5280的博客-程序员秘密

CDN的全称是Content Delivery Network,即内容分发网络。其基本思路是尽可能避开互联网上有可能影响数据传输速度和稳定性的瓶颈和环节,使内容传输的更快、更稳定。使用CDN有3个好处优化跨ISP网络访问速度,在国内大联通和大电信之间是世界上最远的距离,在国外,中国和其他地区很平行,用cdn可以优化全球响应速度节约流量成本,CDN机房都一般都放在带宽便宜的小城...

(gedit:3116): Gtk-WARNING **: cannot open display:错误_y_hh_的博客-程序员秘密

本人是想通过igragh可视化网络的,运行代码时,报了这个错误。在网上也查了挺多解决方案的,最后是通过安装Xming,通过Xming实现可视化操作。Xming 下载地址具体的解决方案和相关配置PS:需要提前运行Xming 程序,界面会在Xming显示。如下图...

推荐文章

热门文章

相关标签