囚徒困境怕拖累最優與納什均衡

囚徒困境、怕拖累最優與納什均衡：

1.囚徒困境：

1.1囚徒困境例子：

兩個共謀犯罪的人被關入監獄，不能互相溝通情況。如果兩個人都保持沉默，則由於證據不確定，每個人都坐牢一年；若一人揭發，而另一人沉默，則揭發者因為立功而立即獲釋，沉默者因不合作而入獄十年；若互相揭發，則因證據確鑿，二者都判刑八年。

1.2 囚徒心理：

假如我是其中乙個囚徒，會這樣思考：如果同夥選擇沉默，自己也沉默的話會被判1年，自己揭發對方的話會無罪釋放，此時選擇揭發更有利；如果同夥選擇揭發自己，自己沉默的話會被判10年，自己也揭發對方的話會被判8年，此時選擇揭發更有利。所以無論對方選擇什麼，我只要選擇揭發對方一定是對於自己的利益最大化。

2.怕拖累最優：

可以看到，兩個囚徒都只考慮自己的利益最大化時，反而並不是最好的，最好的結果就是兩人都保持沉默而背叛一年，我們把這種情況叫做怕拖累最優。

3.納什均衡：

納什均衡本身就是利己主義者的最優策略，在囚徒困境中，我們的納什均衡就是選擇揭發對方。那是均衡並不是追求整體的最優解，而是個人的最優解，對個人而言，是一種穩定的均衡。

納什均衡是一種非合作博弈狀態，而這種非合作博弈狀態也是目前在博弈論中應用最廣的理論，是博弈論中最基本的概念之一。

囚徒困境 怕拖累最優與納什均衡