博弈論(二) Sprague Grundy函式

2022-04-01 01:39:45 字數 4686 閱讀 7665

**:

上一期的文章裡我們仔細研究了nim遊戲,並且了解了找出必勝策略的方法。但如果把nim的規則略加改變,你還能很快找出必勝策略嗎?比如說:有n堆石子,每次可以從第1堆石子裡取1顆、2顆或3顆,可以從第2堆石子裡取奇數顆,可以從第3堆及以後石子裡取任意顆……這時看上去問題複雜了很多,但相信你如果掌握了本節的內容,類似的千變萬化的問題都是不成問題的。

現在我們來研究乙個看上去似乎更為一般的遊戲:給定乙個有向無環圖和乙個起始頂點上的一枚棋子,兩名選手交替的將這枚棋子沿有向邊進行移動,無法移動者判負。事實上,這個遊戲可以認為是所有impartial combinatorial games的抽象模型。也就是說,任何乙個icg都可以通過把每個局面看成乙個頂點,對每個局面和它的子局面連一條有向邊來抽象成這個「有向圖遊戲」。下面我們就在有向無環圖的頂點上定義sprague-garundy函式。

首先定義mex(minimal excludant)運算,這是施加於乙個集合的運算,表示最小的不屬於這個集合的非負整數。例如mex=3、mex=0、mex{}=0。

對於乙個給定的有向無環圖,定義關於圖的每個頂點的sprague-garundy函式g如下:g(x)=mex。

來看一下sg函式的性質。首先,所有的terminal position所對應的頂點,也就是沒有出邊的頂點,其sg值為0,因為它的後繼集合是空集。然後對於乙個g(x)=0的頂點x,它的所有後繼y都滿足g(y)!=0。對於乙個g(x)!=0的頂點,必定存在乙個後繼y滿足g(y)=0。

以上這三句話表明,頂點x所代表的postion是p-position當且僅當g(x)=0(跟p-positioin/n-position的定義的那三句話是完全對應的)。我們通過計算有向無環圖的每個頂點的sg值,就可以對每種局面找到必勝策略了。但sg函式的用途遠沒有這樣簡單。如果將有向圖遊戲變複雜一點,比如說,有向圖上並不是只有一枚棋子,而是有n枚棋子,每次可以任選一顆進行移動,這時,怎樣找到必勝策略呢?

讓我們再來考慮一下頂點的sg值的意義。當g(x)=k時,表明對於任意乙個0<=i對於n個棋子,設它們對應的頂點的sg值分別為(a1,a2,...,an),再設局面(a1,a2,...,an)時的nim遊戲的一種必勝策略是把ai變成k,那麼原遊戲的一種必勝策略就是把第i枚棋子移動到乙個sg值為k的頂點。這聽上去有點過於神奇——怎麼繞了一圈又回到nim遊戲上了。

其實我們還是只要證明這種多棋子的有向圖遊戲的局面是p-position當且僅當所有棋子所在的位置的sg函式的異或為0。這個證明與上節的bouton's theorem幾乎是完全相同的,只需要適當的改幾個名詞就行了。

剛才,我為了使問題看上去更容易一些,認為n枚棋子是在乙個有向圖上移動。但如果不是在乙個有向圖上,而是每個棋子在乙個有向圖上,每次可以任選乙個棋子(也就是任選乙個有向圖)進行移動,這樣也不會給結論帶來任何變化。

所以我們可以定義有向圖遊戲的和(sum of graph games):設g1、g2、……、gn是n個有向圖遊戲,定義遊戲g是g1、g2、……、gn的和(sum),遊戲g的移動規則是:任選乙個子遊戲gi並移動上面的棋子。sprague-grundy theorem就是:g(g)=g(g1)^g(g2)^...^g(gn)。也就是說,遊戲的和的sg函式值是它的所有子遊戲的sg函式值的異或。

再考慮在本文一開頭的一句話:任何乙個icg都可以抽象成乙個有向圖遊戲。所以「sg函式」和「遊戲的和」的概念就不是侷限於有向圖遊戲。我們給每個icg的每個position定義sg值,也可以定義n個icg的和。所以說當我們面對由n個遊戲組合成的乙個遊戲時,只需對於每個遊戲找出求它的每個局面的sg值的方法,就可以把這些sg值全部看成nim的石子堆,然後依照找nim的必勝策略的方法來找這個遊戲的必勝策略了!

回到本文開頭的問題。有n堆石子,每次可以從第1堆石子裡取1顆、2顆或3顆,可以從第2堆石子裡取奇數顆,可以從第3堆及以後石子裡取任意顆……我們可以把它看作3個子遊戲,第1個子遊戲只有一堆石子,每次可以取1、2、3顆,很容易看出x顆石子的局面的sg值是x%4。第2個子遊戲也是只有一堆石子,每次可以取奇數顆,經過簡單的畫圖可以知道這個遊戲有x顆石子時的sg值是x%2。第3個遊戲有n-2堆石子,就是乙個nim遊戲。對於原遊戲的每個局面,把三個子遊戲的sg值異或一下就得到了整個遊戲的sg值,然後就可以根據這個sg值判斷是否有必勝策略以及做出決策了。其實看作3個子遊戲還是保守了些,乾脆看作n個子遊戲,其中第1、2個子遊戲如上所述,第3個及以後的子遊戲都是「1堆石子,每次取幾顆都可以」,稱為「任取石子遊戲」,這個超簡單的遊戲有x顆石子的sg值顯然就是x。其實,n堆石子的nim遊戲本身不就是n個「任取石子遊戲」的和嗎?

所以,對於我們來說,sg函式與「遊戲的和」的概念不是讓我們去組合、製造稀奇古怪的遊戲,而是把遇到的看上去有些複雜的遊戲試圖分成若干個子遊戲,對於每個比原遊戲簡化很多的子遊戲找出它的sg函式,然後全部異或起來就得到了原遊戲的sg函式,就可以解決原遊戲了。這種「分而治之」的思想在下一節介紹的「翻硬幣遊戲」中將被應用得淋漓盡致。還是敬請期待。

上一期的文章裡我們仔細研究了nim遊戲,並且了解了找出必勝策略的方法。但如果把nim的規則略加改變,你還能很快找出必勝策略嗎?比如說:有n堆石子,每次可以從第1堆石子裡取1顆、2顆或3顆,可以從第2堆石子裡取奇數顆,可以從第3堆及以後石子裡取任意顆……這時看上去問題複雜了很多,但相信你如果掌握了本節的內容,類似的千變萬化的問題都是不成問題的。

現在我們來研究乙個看上去似乎更為一般的遊戲:給定乙個有向無環圖和乙個起始頂點上的一枚棋子,兩名選手交替的將這枚棋子沿有向邊進行移動,無法移動者判負。事實上,這個遊戲可以認為是所有impartial combinatorial games的抽象模型。也就是說,任何乙個icg都可以通過把每個局面看成乙個頂點,對每個局面和它的子局面連一條有向邊來抽象成這個「有向圖遊戲」。下面我們就在有向無環圖的頂點上定義sprague-garundy函式。

首先定義mex(minimal excludant)運算,這是施加於乙個集合的運算,表示最小的不屬於這個集合的非負整數。例如mex=3、mex=0、mex{}=0。

對於乙個給定的有向無環圖,定義關於圖的每個頂點的sprague-garundy函式g如下:g(x)=mex。

來看一下sg函式的性質。首先,所有的terminal position所對應的頂點,也就是沒有出邊的頂點,其sg值為0,因為它的後繼集合是空集。然後對於乙個g(x)=0的頂點x,它的所有後繼y都滿足g(y)!=0。對於乙個g(x)!=0的頂點,必定存在乙個後繼y滿足g(y)=0。

以上這三句話表明,頂點x所代表的postion是p-position當且僅當g(x)=0(跟p-positioin/n-position的定義的那三句話是完全對應的)。我們通過計算有向無環圖的每個頂點的sg值,就可以對每種局面找到必勝策略了。但sg函式的用途遠沒有這樣簡單。如果將有向圖遊戲變複雜一點,比如說,有向圖上並不是只有一枚棋子,而是有n枚棋子,每次可以任選一顆進行移動,這時,怎樣找到必勝策略呢?

讓我們再來考慮一下頂點的sg值的意義。當g(x)=k時,表明對於任意乙個0<=i對於n個棋子,設它們對應的頂點的sg值分別為(a1,a2,...,an),再設局面(a1,a2,...,an)時的nim遊戲的一種必勝策略是把ai變成k,那麼原遊戲的一種必勝策略就是把第i枚棋子移動到乙個sg值為k的頂點。這聽上去有點過於神奇——怎麼繞了一圈又回到nim遊戲上了。

其實我們還是只要證明這種多棋子的有向圖遊戲的局面是p-position當且僅當所有棋子所在的位置的sg函式的異或為0。這個證明與上節的bouton's theorem幾乎是完全相同的,只需要適當的改幾個名詞就行了。

剛才,我為了使問題看上去更容易一些,認為n枚棋子是在乙個有向圖上移動。但如果不是在乙個有向圖上,而是每個棋子在乙個有向圖上,每次可以任選乙個棋子(也就是任選乙個有向圖)進行移動,這樣也不會給結論帶來任何變化。

所以我們可以定義有向圖遊戲的和(sum of graph games):設g1、g2、……、gn是n個有向圖遊戲,定義遊戲g是g1、g2、……、gn的和(sum),遊戲g的移動規則是:任選乙個子遊戲gi並移動上面的棋子。sprague-grundy theorem就是:g(g)=g(g1)^g(g2)^...^g(gn)。也就是說,遊戲的和的sg函式值是它的所有子遊戲的sg函式值的異或。

再考慮在本文一開頭的一句話:任何乙個icg都可以抽象成乙個有向圖遊戲。所以「sg函式」和「遊戲的和」的概念就不是侷限於有向圖遊戲。我們給每個icg的每個position定義sg值,也可以定義n個icg的和。所以說當我們面對由n個遊戲組合成的乙個遊戲時,只需對於每個遊戲找出求它的每個局面的sg值的方法,就可以把這些sg值全部看成nim的石子堆,然後依照找nim的必勝策略的方法來找這個遊戲的必勝策略了!

回到本文開頭的問題。有n堆石子,每次可以從第1堆石子裡取1顆、2顆或3顆,可以從第2堆石子裡取奇數顆,可以從第3堆及以後石子裡取任意顆……我們可以把它看作3個子遊戲,第1個子遊戲只有一堆石子,每次可以取1、2、3顆,很容易看出x顆石子的局面的sg值是x%4。第2個子遊戲也是只有一堆石子,每次可以取奇數顆,經過簡單的畫圖可以知道這個遊戲有x顆石子時的sg值是x%2。第3個遊戲有n-2堆石子,就是乙個nim遊戲。對於原遊戲的每個局面,把三個子遊戲的sg值異或一下就得到了整個遊戲的sg值,然後就可以根據這個sg值判斷是否有必勝策略以及做出決策了。其實看作3個子遊戲還是保守了些,乾脆看作n個子遊戲,其中第1、2個子遊戲如上所述,第3個及以後的子遊戲都是「1堆石子,每次取幾顆都可以」,稱為「任取石子遊戲」,這個超簡單的遊戲有x顆石子的sg值顯然就是x。其實,n堆石子的nim遊戲本身不就是n個「任取石子遊戲」的和嗎?

所以,對於我們來說,sg函式與「遊戲的和」的概念不是讓我們去組合、製造稀奇古怪的遊戲,而是把遇到的看上去有些複雜的遊戲試圖分成若干個子遊戲,對於每個比原遊戲簡化很多的子遊戲找出它的sg函式,然後全部異或起來就得到了原遊戲的sg函式,就可以解決原遊戲了。這種「分而治之」的思想在下一節介紹的「翻硬幣遊戲」中將被應用得淋漓盡致。還是敬請期待。

博弈論講解(二)

尼姆博奕 nimm game 公平組合博弈 impartial combinatori games 理論知識 1 若面臨末狀態者為獲勝則末狀態為勝態否則末狀態為必敗態。2 乙個局面是勝態的充要條件是該局面進行某種決策後會成為必敗態。3 乙個局面是必敗態的充要條件是該局面無論進行何種決策均會成為勝態 ...

博弈論講解(二)

尼姆博奕 nimm game 公平組合博弈 impartial combinatori games 理論知識 1 若面臨末狀態者為獲勝則末狀態為勝態否則末狀態為必敗態。2 乙個局面是勝態的充要條件是該局面進行某種決策後會成為必敗態。3 乙個局面是必敗態的充要條件是該局面無論進行何種決策均會成為勝態 ...

博弈論 Nim博弈

1.nim博弈的起源很早,至於歷史我們就不再說了,直接說它的使用場景。1 依舊是兩個人博弈,但是物品時n堆,每一堆有ai個。2 每個人可以挑選一堆取走若干個,但是不能不取。3 最先取完所有物品的人獲勝。4 結論 所以堆的物品的數量異或起來是0,先手必敗。2.乙個nim博弈的例項 nim博弈。乍一看這...