PRML 2 4 指數族分布

2022-10-08 18:18:18 字數 2249 閱讀 8771

\(p(x|\eta) = h(x)g(\eta)exp\\)

\(b站白板推導也有乙個指數族分布標準形式,兩者是等價的\)

\(p(x|\eta) = h(x)exp\\)

\(這裡的u(x)=\phi(x),g(\eta)=\frac}\)

\(\eta^t是乙個向量,自然的u(x)=\phi(x)也是乙個向量函式,a(\eta)是\)log partition function,加上對數的配分函式和歸一化相關

prml書上還展示了乙個伯努利分布轉為指數族分布的例子,這裡介紹正態分佈的轉化例子,b站白板推導也有這部分

\(p(x|\mu,\sigma^2)=\frac}exp\(x-\mu)^2\}\)

轉化為指數族分布形式

\(\eta=\begin

\eta_1\\

\eta_2\\

\end =\begin

\frac\\

}\\\end\)

\(u(x)=\phi(x)=\begin

x \\

x^2\end\)

\(g(\eta)=(-2\eta_2)^}exp(\frac)\)

指數族分布的標準形式

\(p(x|\eta) = h(x)g(\eta)exp\\)

因為是pdf函式,所有積分=1

\(\int_x p(x|\eta) = \int_x h(x)g(\eta)exp\dx =g(\eta)\int_x h(x)exp\dx =1\)

式子\(g(\eta)\int_x h(x)exp\dx\) 對\(\eta\)求導=0 求最大\(\eta\),\(\color\)

\(\nabla g(\eta)\int h(x)exp\dx + g(\eta)\int h(x)exp\ \mu(x) dx=0\)

\(在代入公式 g(\eta)\int_x h(x)exp\dx =1\)

\(得到-\frac}\nabla g(\eta) =g(\eta)\int h(x)exp\ \mu(x) dx =\mathbb[u(x)]\)

\(最後有-\nabla ln g(\eta) =\mathbb[u(x)]\)

\(也就是說有了充分統計了u(x)的均值就能得到指數族分布引數\eta的最優解\)

這是b站的推導

二階導是方差,方差》0,所有a是個凸函式

\(上面是最優\eta的推導,如果給定了一組資料x=\,這時候求\eta的最優解就是求\eta的最大似然解,雖然兩個結論非常近似,但是推導過程不一樣,乙個是直接求導,得到的是\eta 和 u(x)之間的關係,乙個是通過似然函式(所有樣本的累乘),再求導,得到最大似然解\eta\)

\(下面是最大似然估計值\eta_的解析式,注意這裡的\eta_已經是個實實在在存在的乙個數了,上面\eta最優解還是乙個變數\)

b站對最大似然函式的推導

關於共軛先驗的知識本部落格其他章節已經詳述,這裡不再重複了

共軛先驗的優點是先驗和後驗是同乙個分布(對於某個統計量而言),通過假設乙個和後驗一樣的先驗可以計算方便,但是這個假設有點強

最後結論,在最大熵模型下,使得熵最大的分布是指數族分布,剛一看有點驚訝,但其實prml書中已經有了相關說明,在p43,公式1.109下面

最大化微分熵的分布是高斯分布

廣義線性模型

--線性組合 \(w^tx\)

--link function這是啟用函式的反函式

--指數族分布:\(y|x \sim 指數族分布,比如線性回歸:雜訊 y|x \sim n,分類 y|x \sim 伯努利分布\)

概率圖模型

--無向圖:rbm

變分推斷

--如果是指數族分布,可以簡化變分推斷

2 2 2 指數加權平均

下面介紹一下比梯度下降更快的演算法,不過在這之前,你要了解指數加全平均。如1和2所示,指數加權實際上就是設定乙個權值。就像下圖所示 來計算是平均的多少天。如下圖所示 我們要算第100天的平均溫度可以寫成圖中下面0.9的指數形式。由上圖是每天的實際溫度,下面是0.1通過指數衰減過後的函式值。對於v 1...

fafu 1252 指數冪序列

view code fafu 1252 指數冪序列 這題題意很清楚,3的正整數指數冪序列1,3,9,27,81,則第 i 小的組合分別為,若第i 小的組合 的最大乙個數字 n 則前面所有數和來的大,這個可以 自己推看看 我沒推出來,不過自己列一些組合出來,再yy下,應該是這樣的 因此可用2 進製數做...

hdu 2065 指數型母函式

題目 醫學界發現的新病毒因其蔓延速度和internet上傳播的 紅色病毒 不相上下,被稱為 紅色病毒 經研究發現,該病毒及其變種的dna的一條單鏈中,胞嘧啶,腺嘧啶均是成對出現的。現在有一長度為n的字串,滿足一下條件 1 字串僅由a,b,c,d四個字母組成 2 a出現偶數次 也可以不出現 3 c出現...