SCOI2008 獎勵關狀壓期望dp

傳送門

題意：有n種卡(n<=15)，k輪遊戲，每輪遊戲可以抽一張卡(每一輪抽出每種卡的概率都是1/n)，卡的價值為ai(ai可以為負數)，並且某些卡需要另一些卡作為引導即只有在得到某些卡的時候才能獲得這些卡，每輪遊戲抽到的卡可以選擇獲得(前提是前驅卡已經獲得)或者不獲得，求選擇最優策略的情況下的總價值的期望。

題解：顯然可以使用比較容易理解的記憶化搜尋解決，定義dp[i][j]為第i輪狀態為j時，剩下操作能產生的最大價值，結果就是dp[1][0]

記憶化搜尋

#include
using
namespace std;
#define debug(x) cout<<#x<<" is "long
long ll;
const
int maxn=
1e3+5;
double dp[
105][(
1<<15)
];bool vis[
105][(
1<<15)
];ll a[21]
,w[21];
int n,k;
double
dfs(
int x,
int y)
else
}else
} vis[x]
[y]=1;
dp[x]
[y]/
=n;return dp[x]
[y];
}int
main()
}for
(int i=
0;iprintf
("%.6f\n"
,dfs(1
,0))
;return0;
}

也可以直接找出轉移方程直接dp(注意由於終點的狀態不唯一，而起點的狀態唯一，所以倒著進行dp就可以避免討論非法情況(可以這麼理解，由於終點狀態不確定，所以不管從**開始往起點轉移都是可以的，而正著轉移的狀態必須是以0為起點的，那麼就需要特別判斷用於轉移的狀態是否是從起點來的，這增加了不必要的麻煩(通常正著轉移的時候要使用乙個特殊值標記未被轉移的狀態避免用非法狀態轉移)))

#include
using
namespace std;
#define debug(x) cout<<#x<<" is "long
long ll;
const
int maxn=
1e3+5;
double dp[
105][(
1<<15)
];ll a[21]
,w[21];
int n,k;
intmain()
}for
(int i=k;i>=
1;i--
)else dp[i]
[j]+
=dp[i+1]
[j];
} dp[i]
[j]/
=n;}
}printf
("%.6f\n"
,dp[1]
[0])
;return0;
}

SCOI2008 獎勵關狀壓期望dp

SCOI2008 獎勵關題解（狀壓DP 期望）

BZOJ1076 獎勵關（狀壓期望dp）

BZOJ 1076 獎勵關狀壓期望DP

SCOI2008 獎勵關 狀壓 期望dp

SCOI2008 獎勵關 題解（狀壓DP 期望）

BZOJ1076 獎勵關（狀壓期望dp）

BZOJ 1076 獎勵關 狀壓期望DP

相關推薦

SCOI2008 獎勵關狀壓期望dp

SCOI2008 獎勵關題解（狀壓DP 期望）

BZOJ 1076 獎勵關狀壓期望DP