博弈論基礎

2022-06-08 18:15:09 字數 1413 閱讀 7595

具有勝敗遊戲的基礎

通過分析各個狀態的勝敗條件,判斷必勝態和必敗態,是具有勝敗遊戲的基礎。

首先判斷最終狀態的勝敗(比如兩人輪流取硬幣,沒有硬幣可取的一方失敗,則硬幣數\(x==0\)為必敗態)

如果某個狀態的後繼狀態中存在必敗態,則這個狀態為必勝態

如果某個狀態的後繼狀態全部為必勝態,則這個狀態為必敗態

通常使用搜尋或者動態規劃遍歷所有狀態,判斷每乙個狀態是必勝態還是必敗態

對稱策略

對稱策略是一種常見的博弈策略,是指在遊戲中做出對稱狀態後再完全模仿對手的策略

如果輪到自己時可以將狀態分成對稱的兩部分,那麼不管對手怎麼選取,自己只要採取同樣的方法在對稱的部分中選取,就可以重新回到兩個相同部分的狀態。這樣可以使得自己取走最後一件物品,對手在下一回合因為沒有物品可以選擇而失敗

相關題目

hdu1525 euclid's game

給出兩個自然數\(a,b\),兩人輪流進行遊戲,每次將大的數減去小的數的倍數,不能減到小於零,首先得到0的人獲勝,判斷誰會贏得遊戲。

設\(b>a\),如果\(a|b\),則為必勝態,否則分成兩種情況:

\(b-a

\(b-a>a\)

對於第一種情況,由於此時進行遊戲的人只能選擇\(b-a\)的操作,也就是後繼狀態只有一種,所以如果\((b-a,a)\)是必敗態,則\((a,b)\)是必勝態,如果\((b-a,a)\)是必勝態,則\((a,b)\)是必敗態。

對於第二種情況,由於\(b-a>a\),此時進行遊戲的人可以選擇的操作有\(b-a,b-2a,b-3a,\cdots,b-ka(k\leq b/a)\)。設\(b-xa,則如果\((b-xa,a)\)為必敗態,則\((a,b)\)為必勝態。但是如果\((b-xa,a)\)為必勝態,這時的最優策略是轉移到\((b-(x-1)a,a)\)的狀態,因為\((b-(x-1)a,a)\)的後繼狀態只有\((b-xa,a)\),此時\((b-(x-1)a,a)\)為必敗態,所以\((a,b)\)為必勝態。

所以第二種情況一定是必勝態。

所以從初始狀態開始模擬,最先達到情況\(a|b\)或者情況\(b-a>a\)的一方贏得遊戲。

hdu3951 coin game

\(n\)枚硬幣圍成乙個環,兩人輪流取硬幣,每一次可以取\([1,k]\)範圍內的連續的硬幣,沒有硬幣可取的一方失敗,兩人都採取最優策略,判斷誰會贏得遊戲。

先手第一次取過硬幣之後,如果沒有全部取完,則所有硬幣會變成一條鏈,後手可以在鏈的中間根據奇偶性的情況取1枚或者2枚硬幣,使得整條鏈分成完全相同的兩部分,然後後手可以採取對稱策略贏得比賽。

所以當\(n\leq k\)時,先手第一次可以取完所有硬幣,先手贏得遊戲,其他情況除了\(k==1\)之外,全部是後手採取對稱策略贏得比賽,\(k==1\)的情況直接根據\(n\)的奇偶性判斷。

博弈論基礎

模型 一堆n個物品,兩個人輪流從這堆物品中取物。規定每次至少取乙個,最多取m個,最後取光者得勝。hdu 1846 int n,m intmain return0 luogu t115850 nanako s game int main return0 模型 一堆物品,最後操作者勝。操作規則 1 第一...

博弈論基礎

非合作博弈是指一種參與者不可能達成具有約束力的協議的博弈型別,這是一種具有互不相容味道的情形。非合作博弈研究人們在利益相互影響的局勢中如何選決策使自己的收益最大,即策略選擇問題。負和博弈和零和博弈統稱為非合作博弈,正和博弈亦稱為合作博弈。零和博弈是博弈論的乙個概念,屬非合作博弈,指參與博弈的雙方,在...

acm博弈論基礎

一 bash game 巴什博弈 一堆n個物品,兩個人輪流從中取出1 m個,最後取光者勝 不能繼續取的人輸 1,分析 首先n一定可以表示為 n k m 1 r 0 r m 二 wythoff game 威佐夫博弈 有兩堆各若干物品,兩個人輪流從任意一堆中至少取出乙個或者從兩堆中取出同樣多的物品,規定...