囚徒困境 怕拖累最優與納什均衡

2021-09-29 14:56:51 字數 659 閱讀 8698

囚徒困境、怕拖累最優與納什均衡:

1.囚徒困境:

1.1囚徒困境例子:

兩個共謀犯罪的人被關入監獄,不能互相溝通情況。如果兩個人都保持沉默,則由於證據不確定,每個人都坐牢一年;若一人揭發,而另一人沉默,則揭發者因為立功而立即獲釋,沉默者因不合作而入獄十年;若互相揭發,則因證據確鑿,二者都判刑八年。

1.2 囚徒心理:

假如我是其中乙個囚徒,會這樣思考:如果同夥選擇沉默,自己也沉默的話會被判1年,自己揭發對方的話會無罪釋放,此時選擇揭發更有利;如果同夥選擇揭發自己,自己沉默的話會被判10年,自己也揭發對方的話會被判8年,此時選擇揭發更有利。所以無論對方選擇什麼,我只要選擇揭發對方一定是對於自己的利益最大化。

2.怕拖累最優:

可以看到,兩個囚徒都只考慮自己的利益最大化時,反而並不是最好的,最好的結果就是兩人都保持沉默而背叛一年,我們把這種情況叫做怕拖累最優。

3.納什均衡:

納什均衡本身就是利己主義者的最優策略,在囚徒困境中,我們的納什均衡就是選擇揭發對方。那是均衡並不是追求整體的最優解,而是個人的最優解,對個人而言,是一種穩定的均衡。

納什均衡是一種非合作博弈狀態,而這種非合作博弈狀態也是目前在博弈論中應用最廣的理論,是博弈論中最基本的概念之一。

囚徒困境 python

囚徒困境 若兩囚徒都認罪,則各判10年 乙個認罪乙個抵賴,則前者判1年,後者判20年 兩人都抵賴,各判3年。只有兩人都不認罪,程式才會停止。現在有乙個社會學家,在不同的人群中做這個實驗,一旦遇到都不認罪的情況,就停止該人群中的實驗。同時,他希望程式能記錄每一對實驗者的選擇,以及記錄第幾對實驗者都選擇...

囚徒困境困境 深入社會困境

囚徒困境困境 the new issue of pattern matching,onezero s weekly newsletter from senior writer will oremus,is out today.it takes a deep look at the social di...

囚徒困境新感

囚徒困境 是最為大家所討論的乙個博弈論模型,從競爭的角度來講 雙方都會選擇招供,這樣可以盡量遠離最大的損失,從合作的角度來講 雙方都會選擇緘默,這樣能夠使雙方存在乙個雙贏的局面 然而這種現象是最不會出現 由於經濟學的前提是假定人都是理性的 自私 在可預期的選擇上都會盡量遠離最大的損失,向著最大收益的...