展開型博弈

2021-07-11 12:37:04 字數 733 閱讀 5907

對於任一正整數n, 乙個n人展開型博弈(n-person extensive-form game)是對每個結點和每個枝都規定標號的一顆根數,且滿足下列5個條件:

1.每個非終結點有集中的乙個局中人標號(player label)。局中人標號為0的結點稱為機會結點(chance nodes)。集合表示這個博弈的局中人集,並且對此集中的每個i,具有局中人標號i的結點都是被局中人i所控制的決策結點(decision nodes)。

2.機會結點處的每個選擇具有乙個規定其概率的標記。在每個機會結點,這些選擇的機會概率(chance probabilities)都是非負數,且其和為1.

3.乙個局中人所控制的每個結點都有第二個標號,這個標號規定了局路徑到達這個結點時該局中人將擁有的資訊狀態(information state)。當局路徑到達某局中人所控制的乙個結點時,該局中人只知道當前結點的資訊狀態,也就是說屬於同一局中人的兩個結點具有相同資訊狀態的充分必要條件是,當這兩個結點中任何乙個在博弈進行中發生時,此局中人不可能對這兩個結點所表示的局勢加以區分。

4.被乙個局中人所控制的乙個結點,其每乙個選擇都具有乙個行動標號(move label)。進一步說,對於任意兩個具有相同的局中人標號和資訊標號的結點x和y,以及對於結點x處的任何乙個選擇,在y處一定有且僅有乙個與此選擇具有相同行動標號的選擇。

5.在每個終結點,都有乙個指定n個實數的n維向量(u1,…,un)。對於每個局中人i,在此終結點是博弈的結果時,數ui是局中人以某種效用尺度度量的支付(payoff)。

dp基礎之博弈型取石子

問題分析 要求面對n個石子,是否先手必勝 需要知道面對n 1和n 2個石子,是否先手必勝 子問題 設f i 表示面對i個石子,是否先手必勝 f i true false f i true f i 1 false and f i 2 false 拿一顆石子或兩顆石子都輸 true f i 1 fals...

dp基礎之博弈型和區間型結合輪流取數字

問題分析 這是一道博弈型dp,其實質上是區間型dp,目標是讓自己拿到的數字和不必對手小 設己方數字和是a,對方是b,目標是a b,等價於a b 0 也就是說,如果兩人都存著自己與對手的數字和之差,sa a b,sb b a,先手目標是讓sa最大化,後手目標讓sb最大化 當一方x面對剩下的數字時,他的...

博弈 巴什博弈

只有一堆n個物品,兩個人輪流從這堆物品中取物,規定每次至少取乙個,最多取m個。最後取光者得勝。顯然,如果n m 1,那麼由於一次最多只能取m個,所以,無論先取者拿走多少個,後取者都能夠一次拿走剩餘的物品,後者取勝。因此我們發現了如何取勝的法則 如果n m 1 r s,r為任意自然數,s m 那麼先取...