自由能計算,PMF,傘形抽樣,WHAM

2021-10-06 23:22:09 字數 2734 閱讀 3376

你能模擬1-2天的時間嗎?不能,可悲的研究僧們只能跑幾個ns的模擬,以至體系根本無法訪問反應座標上的高能壘部分,他們該腫麼畢業呢? 這時候傘形抽樣橫空出世了。。。苦逼青年有福了。。。

umbrella sampling, firstly proposed by g.m. torrie, j.p. valleau from canada at 1977, 提供了乙個巧妙的方法: 你這個體系不願意待在我反應座標的高能量的段段上不是?哥我用繩子把你栓在那裡。具體做法是用乙個彈簧勢w=k*(x-x0)^2施加在反應物上,一旦反應物座標x不在我設定的x0上,勢能就會公升高,你就得乖乖回來。哥把反應座標切成很多小段(學名叫window),在每一小段上都這樣跑上一會兒,這叫有偏取樣, biased sampling,暴力方式強迫體系沿反應座標前進。可是,我們能接受乙個扭曲的結果嗎?不能啊。有偏取樣的結果,怎麼才能轉換回無偏取樣的概率密度呢?這需要乙個「三步上籃」的過程,叫wham。

wham, weighted histogram analysis method, 加權柱狀圖分析法,目的是把有偏取樣的統計結果轉換為無偏取樣的統計結果,基本思路是這樣的:

第一,首先按照下式依次求第i個window上的無偏概率pi(x),得到n個window區間上的無偏概率密度。

exppi(x) = ---------------- * pib(x)

pi(x), 無偏概率,即w=0時真實概率密度; i 是window的序號, x是反應座標

pib(x), 有偏概率, 即w=wi時的概率密度; b-biased

wi(x), 加在第i個視窗上的有偏勢大小:

第二,總體概率密度p(x)並非是各window上概率密度pi(x)的簡單相加,而是線性組合p(x)=sum

第三,根據p(x), 按照a(x)=-ktln求各點自由能,最終得到pmf。

上面的關鍵是第一步那個公式的理解,和第二步係數ci的求解。

詳細公式看這裡:www.cse.illinois.edu/~ericcyr/uiuc/wham.pdf

我不打算鏖戰於數學細節,而只想說說它背後的思路:

有偏勢w對結果概率密度造成的影響,與有偏勢的大小有關:越大,偏的越多;等於0時得到真實概率密度;因此,w=0時的概率密度,與w=w的概率密度,他們之間呈比例關係,比例係數則與有偏勢能w的boltzmann分布權重exp(wi)有關;可見學好概率是多瑪的重要;

有偏勢w對結果概率密度造成的影響,還與i所處的位置有關,能量低的地方,收到的影響就小,能量高的地方,受到的影響就大,因此第二步ci的計算將考慮這個差別。

好了,傘形有偏抽樣,以及將有偏取樣結果轉換成無偏概率密度並得到自由能勢能面就是這樣的過程。用gromacs,用namd,用charmm, amber都能跑這樣的計算。

傘形抽樣代表了自由能計算的乙個大的分類。另外乙個大的分類,叫熱力學積分,包括什麼微擾啦,緩慢生長啦。。。熱力學積分的思想,與有偏取樣有很大的區別。有偏取樣上面說啦,基於「概率密度–>自由能」這樣乙個關係,而熱力學積分,則是對勢能函式的微擾。它設計乙個逐步微擾的過程,使得通過引數λ從0變到1,則體系從初態變到終態。然後:

∆a=a(λ=1)-a(λ=0)=∫<∂u(λ)/∂λ>dλ

稍具數學基礎的可以看出,在每個λ上模擬,並通過前後λ步模擬可以得到∂u(λ)/∂λ的數值一階導,然後積分,pretty easy。

本質上講,通過引入引數λ,將自由能差這個體系的不可測微觀量轉變了∂u(λ)/∂λ這個可觀測量進行積分。然而,由於基於熱力學積分的模擬方法需要設計乙個轉變路徑,要求體系前後兩個狀態之間差別不大,比如甲烷緩慢長成乙烷以求得二者溶劑化自由能差。然而,你用甲烷長成高分子那就不行了。所以熱力學積分法的應用侷限於非常特定的例子。

熱力學積分引入引數λ,進行逐步平衡態模擬,與前面說的將反應座標分段非常類似。然而,二者有本質不同:自由能與∂u(λ)/∂λ存在積分關係,然而自由能對反應座標沒有任何的直接關係。這也正是兩大類方法的分水嶺。

下面關於umbrella sampling的敘述並不清晰,下面是更新:

原內容:

「umbrella sampling, firstly proposed by g.m. torrie, j.p. valleau from canada at 1977, 提供了乙個巧妙的方法: 你這個體系不願意待在我反應座標的高能量的段段上不是?哥我用繩子把你栓在那裡。具體做法是用乙個彈簧勢w=k*(x-x0)^2施加在反應物上,一旦反應物座標x不在我設定的x0上,勢能就會公升高,你就得乖乖回來。哥把反應座標切成很多小段(學名叫window),在每一小段上都這樣跑上一會兒,這叫有偏取樣, biased sampling,暴力方式強迫體系沿反應座標前進。可是,我們能接受乙個扭曲的結果嗎?不能啊。有偏取樣的結果,怎麼才能轉換回無偏取樣的概率密度呢?這需要乙個「三步上籃」的過程,叫wham。」

補充更正:

其實,不只是在勢能高的地方加勢能w,在反應座標的每個window上,我們都加勢能w。但是,原本勢能低的構象,

反應座標x就在此widow的x0附近就很舒服,晃動不那麼大,那麼計算出來的w就很小;在勢能高的構象上,它老是想

往勢能低的地方滑,不過由於彈簧拴著,所以跑不走,但彈簧給拉的很長,即x-x0很大,那麼計算得到的w當然也就

很大了。最後各window點的概率嘛,按照該第i個window上的平均勢能ui計算,pi(biased)=。這個ui除

了包括這個體系的原子間作用勢能之和之外,還有那個彈簧勢wi。這肯定不行阿,按上面說的話,是扭曲了正確的概

率分布,或者使得正確的概率密度曲線變形了。腫麼辦呢?你上面不是有每次取樣的拉力w嗎,你可以統計得到在這個

window上取樣的平均,這個就是把概率拉變形的罪魁勢能,把這個從平均ui裡面減去就行了阿。

關鍵路徑計算 總時差 自由時差

1.關鍵路徑 2.總時差與自由時差的區別 總時差是指在不延誤專案完成日期或違反進度因素的前提下,某活動可以推遲的時間。總時差 ls es lf ef 自由時差是指在不影響緊後活動最早開始的情況下,當前活動可以推遲的時間。自由時差 後一活動 es 前一活動的 ef 所以總時差影響總工期,自由時差影響緊...

關鍵路徑計算 總時差 自由時差

1.關鍵路徑 2.總時差與自由時差的區別 總時差是指在不延誤專案完成日期或違反進度因素的前提下,某活動可以推遲的時間。總時差 ls es lf ef 自由時差是指在不影響緊後活動最早開始的情況下,當前活動可以推遲的時間。自由時差 後一活動 es 前一活動的 ef 所以總時差影響總工期,自由時差影響緊...

自由空間傳播模型 計算的實現

1.自由空間傳播 自由空間是指在理想的 均勻的 各向同性的介質中,電波傳播不發生反射 折射 繞射 散射以及吸收現象,只存在由於電磁波能量在傳輸過程中擴散而引起的傳播損耗。2.自由空間傳播模型 在自由空間中,設發射功率為 pt,接收功率為pr,那麼 其中,ar 2 gr 4 為工作波長,gr與gt分別...