博弈論學習筆記

2021-08-19 13:23:45 字數 1681 閱讀 4286

** 

個人實在太懶 所以直接抄啦~~

點球案例

在一次足球比賽罰點球時,罰球隊員可以選擇l,m,r三種不同射門路徑;門將可以選擇撲向左路或者右路(原則上講他也可以守在右路)。lr

l4,-4

9,-9

m6,-6

6,-6

r9,-9

4,-4

該錶表示各自的收益,其中,lr對應的9表示當射手射向左路而門將撲向右路時,射手有90%的概率進球,-9表示門將有90%的概率丟球(10%概率射偏)。其他收益以此類推。

我們假設門將撲向右路的概率是pr,那麼門將撲向左路的概率是pl=1-pr。

那麼,射手

選擇左路的預期收益為 eu1(l,pr) = pl*u1(l,l) + pr*u1(l,l) = (1-pr)*4 + pr*9 = 4 + 5*pr;

選擇中路的預期收益為 eu1(m,pr) = pl*u1(l,l) + pr*u1(l,l) = (1-pr)*6 + pr*6 = 6;

選擇右路的預期收益為 eu1(r,pr) = pl*u1(l,l) + pr*u1(l,l) = (1-pr)*9 + pr*4 = 9 - 5*pr;

結論:

從中路射門都不是乙個最佳策略;不要選擇在任何信念下都不是最佳策略的策略。

定義:參與者i的對策si是對手的策略s-i的最佳對策,當且僅當對於參與者i的所有其他策略si',u1(si,s-i)>=u1(si',s-i)

商業合作案例

兩個參與者都是公司的股東,他們都持有公司的股份並且平分利潤。

si表示第i**東為公司付出的精力。i=1,2。

總收益為4*(s1 + s2 + b*s1*s2)

所以對於每個參與者,他們能夠獲得的收益是1/2*4*(s1 + s2 + b*s1*s2) = 2*(s1 + s2 + b*s1*s2)

我們現在來考慮參與者1,他的付出是s1^2,s所以他的淨收益為:2*(s1 + s2 + b*s1*s2) - s1^2

為了讓收益最大,對s1求導得出收益導數為0的方程:s1 = 1 + b*s2

同理,對於s2,s2 = 1 + b*s1

我們這裡設b=1/4。s=[1,4]。

這裡看一看到,因為s1的範圍只在1和2之間,所以[0,1]和[3,4]是s1的劣勢策略;

同理,[0,1]和[3,4]是s2的劣勢策略。

所以剔除之後剩下了s1∈[1,2],s2∈[1,2]這個區間,我們將其放大四倍,發現了和原來一樣的圖。

然後我們就可以接待進行剔除了。

最後得到的點就是方程組:

s1 = 1 + b*s2

s2 = 1 + b*s1

的解。得出:

s1 = s2 = 1/(b-1)

(1/(b-1), 1/(b-1))這個點稱為納什均衡 nash equilibrium

這意味著博弈雙方彼此都不想偏離納什均衡點。在納什均衡點處,雙方都採取彼此的最佳對策。

博弈論學習筆記

eg hdu2149,2156 描述 只有一堆n個石子,每次能取1到m個物品,a先手,問誰能先取完石子 思路 這種問題的關鍵就在於能否取到關鍵點,比如,這裡只能能取到倒數m 2個石子,留下m 1個石子,則後者就必敗。結論 如果初始石子是 m 1 的倍數,則先手必敗,否則先手必勝。eg hdu2177...

學習筆記 博弈論

博弈論的題比較重思路,都比較好寫,所以我打算腦內做題不寫 梳理一下遇到的博弈論題目的思路。題意是給乙個由數字0 9和問號構成的字串,長度為n,n為偶數 需要注意可能沒有問號 b和m兩人輪流用數字替換問號,m先手,若所有問號都被替換後前一半的數字之和等於後一半的數字之和,b勝,否則m 勝。考慮三種情況...

博弈論學習筆記

好久以前不記得在那本初賽資料上看到第一章就是博弈論,看了一頁紙,那時候還不知道有多難,就只是感性地用數學去理解 感覺不難,就沒搞了。考了好幾次博弈論的題,發現毛都不會,又老聽旁邊 mital 和 skounputer 講什麼 sg 函式,心態 於是還是決定自己學一下。蒟蒻決定先把幾個經典的例子學會了...