博弈論學習 一 基礎

2021-10-01 10:08:04 字數 324 閱讀 2282

大多數應用非合作博弈,所以這本書主要也在介紹非合作博弈。根據上述分類,非合作博弈可以分為以下四種:

純策略:最基本的策略,參與者在某種狀態只能採用一種行動選擇;

混合策略:參與者在某種狀態以概率分布的形式隨機選擇策略集中的行動;

帕累託優於:指資源分配的一種理想狀態,假定固有的一群人和可分配的資源,從一種分配狀態到另一種狀態的變化中,在沒有使任何人境況變壞的前提下,使得至少乙個人變得更好。帕累託優於又稱帕累託改進,是達到帕累託最優的路徑和方法;

博弈論基礎

模型 一堆n個物品,兩個人輪流從這堆物品中取物。規定每次至少取乙個,最多取m個,最後取光者得勝。hdu 1846 int n,m intmain return0 luogu t115850 nanako s game int main return0 模型 一堆物品,最後操作者勝。操作規則 1 第一...

博弈論基礎

非合作博弈是指一種參與者不可能達成具有約束力的協議的博弈型別,這是一種具有互不相容味道的情形。非合作博弈研究人們在利益相互影響的局勢中如何選決策使自己的收益最大,即策略選擇問題。負和博弈和零和博弈統稱為非合作博弈,正和博弈亦稱為合作博弈。零和博弈是博弈論的乙個概念,屬非合作博弈,指參與博弈的雙方,在...

博弈論基礎

具有勝敗遊戲的基礎 通過分析各個狀態的勝敗條件,判斷必勝態和必敗態,是具有勝敗遊戲的基礎。首先判斷最終狀態的勝敗 比如兩人輪流取硬幣,沒有硬幣可取的一方失敗,則硬幣數 x 0 為必敗態 如果某個狀態的後繼狀態中存在必敗態,則這個狀態為必勝態 如果某個狀態的後繼狀態全部為必勝態,則這個狀態為必敗態 通...