MOOC 浙江大學 博弈論基礎 學習筆記(二)

2021-08-30 11:12:54 字數 1428 閱讀 2663

第一講(下)

博弈的術語

1.參與人(players):理性選擇的主體。

2.資訊(information):參與者有關博弈的知識。「知己知彼,百戰不殆」。

3.行動(action):參與者能夠選擇的變數。

4.策略(strategies):參與者在行動之前所準備好的一套完整的行動方案(預案)。

具有以下三種特點:

(1)完整性

(2)多樣性

(3)不可觀察性

人不犯我,我不犯人;人若犯我,我必犯人。

例項:自九一一事件以來,美國實行五級安全警戒系統。按危險程度,由低至高分別為綠色、藍色、黃色、橙色和紅色。

好的應急預案,需包括:1.what(資訊分類)?2.who(責任到人)?3.action(措施具體)?4.when(時效性)?

5.損益(payoff):參與者的得與失。

6.結局(outcome):所有參與者選擇各自策略後的結果。

7.均衡(equilibrium):所有參與者的最優策略組合。

8.博弈的規則(rules of the game):參與者、行動和結果合起來稱為博弈的規則。

9.博弈論(game theory):是一種研究人們怎麼做策略(行動)選擇及其最後的均衡結果會是什麼的理論。

博弈的分類

1.合作博弈和非合作博弈

合作博弈:指參與者能夠達成一種具有約束力的協議,在協議範圍內選擇有利於雙方的策略。

非合作博弈:指參與者無法達成這樣一種協議。

2.靜態博弈和動態博弈

靜態博弈:指在博弈中,參與者同時選擇,或雖非同時選擇,但是在邏輯時間上是同時的。

動態博弈:指在博弈中,參與者的行動有先後順序,且後行動者能夠觀察到先行動者的行動。

3.完全資訊博弈與不完全資訊博弈

完全資訊博弈:指在博弈中,每個參與者對其他參與者的型別、策略空間及損益函式都有準確的資訊。

不完全資訊博弈:總有一些資訊不是所有參與者都知道的。

2和3可以組合為完全資訊靜態博弈(納什均衡)、完全資訊動態博弈(澤爾騰)、不完全資訊靜態博弈(海薩尼-貝葉斯納什均衡)、不完全資訊動態博弈(澤爾騰)

4.零和博弈與非零和博弈

零和博弈:指博弈前的損益總和與博弈後的損益總和相等。

非零和博弈:指博弈後的損益大於(小於)博弈前的損益總和。(正和、負和)

不玩負和遊戲,少玩零和遊戲,多玩正和遊戲。

特別提示

1.策略讓我們建立起了從資訊到行動的快速反應機制,從而能夠以最快的速度做出行動選擇。

資訊–>策略–>行動

浙江大學公開課 博弈論基礎良句收錄和觀後觀想

b站課程鏈結 良句 雙人零和博弈 乙個人收益是另乙個人的損失 博弈既可以是競爭,也可以是合作 我們不喜歡買便宜的東西,但是我們喜歡佔便宜 不要讓別人做判斷題,而要讓別人做選擇題 參考標準一定要自己定,不要讓別人發給你參考標準 我們對收益和損失的敏感度不一樣,我們對虧損要敏感的多 既然事情已經發生,那...

博弈論學習筆記

eg hdu2149,2156 描述 只有一堆n個石子,每次能取1到m個物品,a先手,問誰能先取完石子 思路 這種問題的關鍵就在於能否取到關鍵點,比如,這裡只能能取到倒數m 2個石子,留下m 1個石子,則後者就必敗。結論 如果初始石子是 m 1 的倍數,則先手必敗,否則先手必勝。eg hdu2177...

博弈論學習筆記

個人實在太懶 所以直接抄啦 點球案例 在一次足球比賽罰點球時,罰球隊員可以選擇l,m,r三種不同射門路徑 門將可以選擇撲向左路或者右路 原則上講他也可以守在右路 lr l4,4 9,9 m6,6 6,6 r9,9 4,4 該錶表示各自的收益,其中,lr對應的9表示當射手射向左路而門將撲向右路時,射手...