博弈論讀書筆記(一) 囚徒困境

2021-09-29 08:43:47 字數 1228 閱讀 8844

囚徒困境的主要內容是兩個共謀的犯人被抓緊監獄,並且分別關押在不同的房間裡,這個時候他們無法進行有效溝通。警察也沒有找到足夠的犯罪證據,所以分別對兩個犯人說:如果兩人都對自己的犯罪事實抵賴,那麼將各判刑1年;如果兩人都坦白自己的犯罪事實,每個人都會被判8年;如果兩人中一人坦白而另一人始終抵賴,那麼坦白的會直接被放出去,而抵賴的會被判10年。

在囚徒困境中的「困境」主要**於資訊不明確可能帶來的決策失誤。如果雙方在進入監獄之前就約定都要矢口抵賴,那麼最終的結果可能對彼此都有利,達到帕累託最優(帕累託最優是資源分配的一種理想狀態)。

但是從囚徒困境這個案例來看,帕累託最優方案的實現往往很困難,由於雙方無法溝通,且擔心對方對自己做出不利的選擇,為保險起見,只好選擇坦白。從某種意義上,這種坦白意味著對對方的背叛而非合作,因為人更希望另一方能夠採取抵賴的姿態,但另一方通常會堅定地選擇坦白。

有人提出:重複囚徒困境,讓兩名犯人有機會去「懲罰」和「報復」前一回合不採取合作態度的同伴,從而逼迫雙方不斷採取合作的態度,最終有效保證雙方的決策逐漸趨於帕累託最優。問題在於,一旦約定了重複的次數,情況就會有所不同。

以十局為例,按照正常的推論而言,犯人a第一次被犯人b背叛後,第二次他也會背叛對方作為回應。如果犯人b第一次就選擇沉默,堅決不認罪,那麼雙方可能建立起互信關係。在這裡,保持沉默的態度是為了讓對方在下一局也能做出相同的回應。接下來的第三局、第四局可能都是如此。

問題是:雙方會一直採取這種合作態度嗎?情況可能並非如此,由於約定了重複的囚徒困境為十局,那麼第十局其中一方可能採取背叛的態度,因為這是他最後的機會來逃脫坐牢的命運。

根據這一點,可以往前推。對於兩名犯人,他們都會猜測對方可能在第十局背叛自己,那麼第九局時保持沉默與合作的態度已經毫無意義,因為這原本就是為第十局做出沉默策略做鋪墊的,既然第十局雙方有可能背叛,那麼兩人在第九局就沒有必要保持沉默。以此類推,第八局雙方也會背叛對方,第七局同樣也會…這樣一來,直到第一局,雙方都會採取互相背叛的策略。

*也就是說,在重複十局的囚徒困境中,每一句雙方都會以互相背叛的方式繼續下去。

可以說,想通過重複囚徒困境的方式來打破相互背叛的僵局,實現帕累託最優,前提條件是不能給出具體的次數,因為一旦規定了次數,那就意味著每乙個人都有機會通過背叛的方式來實現「不用坐牢」的目的。

囚徒困境(博弈論的詭計)

在史達林時代的蘇聯,有一位樂隊指揮坐火車前往下乙個演出地點。正當他在車上翻看當晚就要指揮演奏的作品樂譜時。兩名克格勃將他作為間諜逮捕了。他們以為那樂譜是某種密碼,這位樂隊指揮爭辯說那只是柴可夫斯基的小提琴協奏曲,卻無濟於事。在樂隊指揮被投入牢房的第二天,審問者自鳴得意地走進來說 我看你最好還是老實招...

博弈論 囚徒困境與重複囚徒困境的啟示

囚徒困境 囚徒困境 prisoner s dilemma 討論的是兩個 的囚徒之間的一種博弈,它闡明了為什麼 在合作對雙方都有利時,保持合作也是困難的 囚徒困境的故事講的是,兩個嫌疑犯作案後被警察抓住,分別關在不同的屋子裡接受審訊。警察知道兩人有罪,但缺乏足夠的證據。警察告訴每個人 如果兩人都抵賴,...

博弈論 囚徒困境與重複囚徒困境的啟示

博弈論 囚徒困境與重複囚徒困境的啟示 囚徒困境 囚徒困境 prisoner s dilemma 討論的是兩個 的囚徒之間的一種博弈,它闡明了為什麼 在合作對雙方都有利時,保持合作也是困難的 囚徒困境的故事講的是,兩個嫌疑犯作案後被警察抓住,分別關在不同的屋子裡接受審訊。警察知道兩人有罪,但缺乏足夠的...