讀書筆記 《MBA 輕鬆讀(第二輯) 博弈論》

2021-10-09 23:49:18 字數 4688 閱讀 6443

在被稱為"囚徒困境"的一對一單次同時博弈之中,如果各參與者都選擇佔優策略,就會導致比合作更壞的情況。

使佔優策略失效的方法:

對被背叛者施加懲罰

增加博弈(交易)次數

納什均衡指的是所有參與者"在考慮到其他參與者採取策略的前提下選擇自己最合適的策略"的狀態。這種均衡並非只有乙個,往往存在多個。在滿足納什均衡的狀態下,任何參與者打破均衡採取其他的策略都會使自身收益受損害,因此這種穩定的狀態會一直持續下去。

納什均衡就是:所有參與者都在"以其他參與者的策略為前提的情況下,選擇自己最合適的策略"的狀態。也就是說,一旦參與者們選擇了滿足納什均衡的策略,那麼不管博弈中的任何參與者選擇其他任何策略,都不能使自身的收益增加。雖然在博弈中納什均衡策略並不是唯一的,但是如果只有自己改變策略,並不能使收益得到提高。

納什策略一旦實現,任何參與者都不能再選擇其他策略。

納什均衡一旦形成,所有參與者在只有自己選擇其他策略的情況下都會使自身的收益收到損害。

不管對方如何隨機選擇,自己的期望收益都固定不變的狀況被稱為混合策略納什均衡。

歸根到底還是概率的問題。關鍵在於選擇能夠讓期待值最大化的策略組合。

在這個博弈中不但不存在佔優策略,甚至也不存在滿足納什均衡的策略組合。這意味著不管參與者選擇矩陣中的哪乙個策略組合,只要收益較少的參與者改變策略,那麼改變策略的參與者就能獲得更多的收益。

混合策略納什均衡:在所有參與者都維持當前隨機化概率的前提下,只有一名參與者改變隨機化概率無法增加自身收益的狀態。

在這種各參與者相互之間存在利害關係的多人博弈之中,如何避免參與者隨機化選擇導致選中收益劣勢策略,以及促使參與者都選擇能都獲得最高收益的純策略納什均衡,對於所有參與者來說都至關重要。

首先計算混合策略納什均衡的隨機化概率,然後促進混合策略納什均衡達到這個概率,而避免選中收益劣勢的策略

在市場處於寡頭壟斷下且擁有無限多個(連續的)純策略的情況下,可以用古諾競爭模型和伯川德競爭模型來對策略進行分析。在這種情況下,自身的收益會受到對方策略的影響。

對於選項較少的博弈,只要通過收益矩陣就可以簡單地進行說明,但博弈論中也存在連續的情況,因此分析也會變得更加複雜。

古諾競爭

納什均衡策略是各個策略曲線的交點:任何參與者單方面選擇納什均衡策略之外的策略,都無法提高自身的收益。

核心理論還是計算並推動納什均衡策略

伯川德競爭

如果說古諾競爭是對產量做連續選擇的策略,那麼伯川德競爭就是對**做連續選擇的策略。

「兩個參與者都給出無限接近與成本的**,兩個參與者的收益也都無限接近於零」是唯一乙個完全符合納什均衡的策略。

總結在古諾競爭下能夠通過納什均衡確保自身收益的各參與者,在伯川德競爭之中因為**競爭的原因,不得不選擇沒有收益的均衡點。

在博弈中,我們首先要搞清楚什麼樣的博弈狀況對自身有利,然後思考是否能夠將博弈的規則朝著對自身有利的方向轉變

當改變某種條件時,博弈的結構也將發生巨大的變化。

既然改變規則就能改變結果,那麼應該如何將博弈的結構和規則向對自己有利的方向改變呢?

在商業活動中取得成功的乙個秘訣就是:不但要適應規則,還要想辦法將規則變得對自己有利。

序貫博弈最大的特點就是,位於後手的參與者可以根據先手參與者選擇的策略來選擇自己的新策略。因此先手參與者的行動就相當於「全新的資訊」,給後手參與者的行動造成影響。在序貫博弈中還存在子博弈。

必須先對自身所處的狀況以及對手的反擊行動進行謹慎的分析之後,再決定是否接受對方的建議

逆向歸納法從最後乙個子博弈依次逆推到第乙個分歧點,分析各參與者都會選擇什麼策略

通過末端分歧點為起點的子博弈來分析參與者會選擇什麼策略。

將做出相應選擇後參與者所能獲得的收益作為前提。

逆推到前乙個分歧點(子博弈),思考參與者會選擇什麼策略。

結果發現在整個博弈的每個子博弈中,各參與者都會選擇納什均衡策略。這種策略組合被稱為滿足「子博弈精煉均衡」

子博弈精煉均衡在序貫博弈中是比納什均衡更加強大的均衡概念。

讓博弈向有利於自身的方向發展:

如果同乙個博弈重複進行,可能會出現在單次博弈中難得一見的參與者相互合作的情況。在重複博弈中為合作關係提供保障的是其中一方背叛後其他參與者可能採取的「報復威脅」。

逆向歸納悖論:只存在乙個均衡策略的博弈重複有限次數的情況下,基於逆向歸納法找出各子博弈中的均衡策略是唯一符合子博弈精煉均衡的策略。

在囚徒困境中,各子博弈都只存在單獨均衡的情況,基於「報復威脅」的合作關係就無法發揮作用。但這個問題可以通過將博弈變成無限重複來解決

無限重複博弈最大的特點就是不存在最後一次的子博弈。這樣參與者就可以從自己不喜歡的佔優策略中擺脫出來。在這種情況下要想維持合作關係,「報復威脅」必須長期具有可信性。因此,通過某種行動來使策略發生永久性轉變的「觸發策略」十分有效。

無限重複博弈的特點就是不存在最後一次的子博弈,也就意味著無法使用對序貫博弈和有限重複博弈進行分析是使用的逆向歸納法

在無限重複博弈中,因為「報復威脅」的存在,各參與者可能會採取合作的策略,而非子博弈精煉均衡策略。但是如果一方背叛,就會選擇為收益較低的子博弈精煉均衡策略。這種「以某種行動為契機永久轉變策略」的策略被稱為「觸發策略」

如果把獲得的收益換算成現價值的情況下,投資收益率(將來收益與現在收益的比率,也可以稱之為時間偏好率)也會成為影響雙方是否能夠在重複博弈中維持合作關係的因素。

在商業活動中,一味追求眼前利益而置長遠於不顧,那麼很難培養出長期的合作關係。如果交易雙方都對金錢有過度的追求,那麼很難培養出長期的合作關係。交易物件之間要想實現合作關係,首先要每一位參與者對獲取收益擁有足夠的耐心。

資訊的重要性:

資訊是繼人才、物資、資金之後的第四大經營資源。

掌控資訊的人將掌控整個世界。

要想讓別人按照自己的想法行動,就必須了解自己與對方之間存在怎樣的資訊差,以及這個資訊差擁有什麼意義,並且能夠靈活地加以運用。

利用資訊差的關鍵,在於將自己身處的狀況放到乙個視覺化的結構之中,然後思考是否能夠改變這個結構

非對稱資訊博弈中應用範圍最廣的是訊號博弈。在這種博弈中,擁有資訊的參與者會根據自己擁有的資訊選擇策略,而這種參與者的行動就會發出乙個訊號,其他沒有資訊的參與者會根據這個訊號來推測參與者擁有什麼資訊,並以此為基礎選擇自己的策略。

在非對稱資訊的情況下,資訊較少的參與者,需要通過資訊較多的參與者的行動以及外部能夠觀察到的訊號來推測對方的真實狀態。

根據「逆向選擇悖論」的推導:在資訊非對稱的情況下,由於高品質商品和低品質商品混雜,參與者的猜忌會使市場交易中商品的**持續走低。更重要的是,**持續走低會導致市場中提供高品質商品的賣家選擇退出,結果出現市場規模縮小甚至徹底消失,即市場失靈的情況。防止這種情況,最直接的辦法就是提高賣家將低品質偽裝成高品質的成本。

貝葉斯均衡和納什均衡最大的區別在於,納什均衡中考慮的收益是「確定收益」,而貝葉斯均衡中考慮的收益是期望收益。使各參與者的期望收益最大化策略的情況被稱為精煉貝葉斯均衡。滿足精煉貝葉斯均衡的策略就具有「可信性」。

對於連續進行非對稱資訊博弈的參與者來說,有時候通過犧牲眼前的利益,不讓其他參與者把握自己的策略對結果更為有利。也就是說,擁有資訊的一方可以通過對資訊的操控使訊號博弈朝有利於自己的方向發展。

在非對稱資訊博弈連續重複的情況下,資訊操作策略十分有效:連續進行的非對稱資訊博弈與單次博弈之間最大的區別在於,參與者會不惜犧牲眼前的利益,也要採取隱瞞自己真實身份的策略,而這種策略往往對最終的結果是有利的。資訊操作策略的價值將隨著博弈重複的次數而不斷提公升。

實際的商務活動大多是連續的非對稱資訊博弈

委託人與**人的博弈,主要分析委託人如何讓**人按照自己的想法進行工作,以及**人如何獲得與自己付出的努力和取得的成果相當的回報。

委託人和**人之間必然會出現博弈關係。因為委託人希望**人能夠以最小的成本取得最大的成果,而**人希望能夠花費最少的時間和精力滿足委託人的需求。

拍賣根據是否能夠把握對方的行動,分為公開型拍賣和非公開型拍賣。前者公開進行,買家都知道其他買家的行動,相當於重複同時博弈;後者相當於同時博弈。

根據自己的評估**選擇弱佔優策略:

根據第二買家的評估**選擇佔優策略:

拍賣理論應用於商業:

事先把握拍賣的形式

警惕贏者詛咒(使用評估**較低的**)

同盟協議的穩定性和拍賣的形式有關

在有限次數序貫博弈的情況下,擁有最終提案權的參與者處於有利局面,但如果隨著交涉次數的增加其收益率減少越多,當交涉次數達到一定程度時,博弈就會對最初的提案者有利。

Thinking in Java讀書筆記 第二章

萬物皆物件 一 儲存器 1 棧 存放物件的例項,基本型別等 2 堆 存放物件,類型別等 3 靜態儲存 存放static變數 二 資料型別 基本型別 大小最小值 最大值類型別 預設值 boolean 1 bit boolean false char 16 bit unicode 0 unicode 2...

《Clean Code》讀書筆記 第二週

本週我閱讀了 clean code 神在細節中!建築家範德羅如是說。他當然專注於基於巨集偉構架之上的永恆建築形式,他也同樣為自己設計的建築挑選門把手。同樣軟體開發也是這樣,小處見大。在巨集偉的建築作品中,我們也要關注細節的迴響。重點便是整理,從而達成clean。乙個很好的例子是對於變數命名,認真對待...

第二章 讀書筆記

第二章主要講的內容是搭建android 底層開發環境 其中包括 android 應用程式開發環境 android ndk 開發環境和交叉編譯環境的搭建。由於 android 基於linux 核心,所以搭建環境需要使用 linux 作為開發 linux 驅動的平台。它的底層開發需要的工具包含眾多的程式...