Gromacs分子動力學模擬流程概述

2021-10-06 08:58:45 字數 4448 閱讀 5687

gromacs分子動力學模擬主要可以分為以下幾個步驟,不同的體系步驟可能略有不同。

在開始之前,先簡單了解一下預平衡:

分子動力學模擬的最終目的是對體系進行抽樣,然後計算體系的能量,各種化學鍵,成分分析等等。打個比方說,我們有乙個蛋白質,我們想將它放入一種溶液中(可能是水,也可能不是),然後看看這個體系的能量如何變化,蛋白質的化學鍵,與水分子形成的氫鍵等等資訊,那麼我們需要將蛋白質放入溶液中,對映到現實中就是講溶劑放入溶劑中,然後等體系穩定後,觀察其性質。

在md中,這一過程不向現實中一樣是自然發生的,我們需要通過模擬是體系演化到平衡狀態,這就是預平衡。一般來說預平衡會有以下辦法:

蛋白質結構能量最小化:pdb檔案都是從晶體中獲得的,所以蛋白質放入溶液中後必然會發生變化,這就需要對其進行能量最小化,確保蛋白質的結構是穩定結構。

蛋白質位置限定性模擬:有時加入溶劑後,分子間相互作用力會過大,導致蛋白質體系崩潰。這時我們需要限制蛋白質中重原子的位置,維持其結構,等溶劑分子弛豫之後再放開限制進行模擬。

nvt預平衡,npt預平衡:一般先做nvt模擬,減小盒子內壓力,然後再做npt模擬。

以上步驟當然不用全做,視情況而定,不過一般蛋白質能量最小化和位置限定性npt還是要做的。

以下是分子動力學模擬的步驟,有些步驟可以省略。

2. 使用pdb2gmx獲得拓撲檔案

命令pdb2gmx的詳細資訊可以參加具體的命令引數我會在另一篇文章中詳述。一般而言,我們使用時會是向下面這樣:

gmx pdb2gmx -ff amber99sb-ildn -f *.pdb -o *.gro -p *.top -water tip3p

-ff 選項,制定要使用的力場;

-f選項,制定輸入的pdb檔案;

-o選項,制定生成的gro檔名

-p選項,制定要生成的拓撲檔名

-water選項,制定要使用的水分子模型

注意,除了生成*.gro檔案和*.top檔案之外,還會生成乙個posre.itp,位置限定性檔案(我把它理解成position-restraints的縮寫)。

如果不使用-ff選項的話,指令執行後會讓你自行選擇力場。

3. 定義盒子

定義盒子和填充溶劑可以看做一步,在這裡為了詳細就分開來說。

gmx editconf -f *.gro -o *.gro -c -bt cubic -d 1.2

-f:指定輸入的蛋白結構

-o:指定輸出帶盒子資訊的結構檔案

-c:將蛋白質置於盒子的中心,這個選項是可選的,不必須。

-d:蛋白質與模擬盒子在xyz方向上的最小距離,一般不能小於0.9nm

-bt:指定盒子型別,這裡使用了立方盒子,還可以用八面體,十二面體等。

這樣我們就得到了週期型立方格仔中的蛋白質分子。

editconf命令可以用於gro檔案與pdb檔案的相互轉換。用-f指定原始檔,-o指定所需檔名即可。

4. 蛋白質真空中的能量最小化(非必須)

一般而言這一步不是必須的,不過這裡還是簡述一下。如果我們只需要在真空中進行能量最小化的化,下一步就可以直接成品模擬了。

gromacs使用grompp指令(gromacs pre-preocessor)對帶有格仔資訊的gro檔案與蛋白質的拓撲檔案,還有mdp檔案進行處理,從而得到用於mdrun的輸入檔案*.tpr。tpr為二進位制檔案。具體指令如下:

gmx grompp -f *.mdp -c *.gro -p *.top -o *.tpr

-c:指定輸入結構檔案

-p:指定輸入拓撲檔案

-o:指定用於mdrun的tpr檔案

執行之後我們得到*.tpr檔案和引數檔案mdout.mdp

然後使用mdrun命令執行能量最小化:

gmx mdrun -v -deffnm *

-v:顯示模擬過程中的資訊

-deffnm:我把它理解成define-file-name的縮寫。定義輸出檔名,檔案字尾會自動加上。

執行後得到日誌檔案*.log,全精度軌跡問價*.trr,能量檔案*.edr,能量最小化的結構檔案*.gro。

5. 向盒子中填充溶劑

其實這只是一小步,同上,為了詳細我把它單獨列為一步。

使用solvate命令填充溶劑,以水為例:

gmx solvate -cp *.gro -cs *.gro -o *.gro -p *.top

-cp:指定需要填充水分子的體系,即前面我們用editconf得到的帶格仔的結構檔案

-cs:指定要使用的水模型

-p:指定體系的拓撲檔案(原蛋白質的拓撲檔案),這樣solvate就可以修改體系的拓撲檔案。

-o:指定填充水分子後的輸出檔案

執行之後我們可以得到得到-o所指定的檔案,並且-p指定的top檔案也會發生改變。

6. 新增離子

向盒子中新增溶劑之後,我們得到了乙個帶電荷的溶液體系,因此必須進行中和。gromacs中新增離子的指令是genion(我把它理解成generate-ion的縮寫),但是不巧的是genion需要的輸入檔案為tpr檔案。跟前面一樣,這需要grompp(gromacs pre-processor)來產生。grompp可以處理座標檔案和拓撲(描述分子的檔案)從而產生原子級別的輸入檔案,即tpr檔案,tpr檔案包含了體系中所有原子的引數。

為了將座標資訊(gro)和拓撲資訊(top)結合起來,我們需要乙個mdp檔案。mdp檔案通常用於進行能量最小化,這裡只是簡單的生成tpr檔案。

gmx grompp -f *.mdp -c *.gro -p *.top -o *.tpr

-f:指定mdp檔案

-c:指定結構檔案(加入溶劑後的結構檔案)

-p:指定拓撲檔案(還是之前生成的蛋白質拓撲,當然在加入溶劑時該檔案發生了變化)

-o:指定輸出檔案

得到tpr檔案後,就可以在其中加入離子了:

gmx genion -s *.tpr -o *.gro -p *.top - pname * -nname * -nn *

-s:將上述生成的tpr檔案作為輸入

-o:生成新的結構檔案

-p:再次改變top檔案,反應蛋白質結構的改變

-pname:指定要新增的陽離子名稱,後面未指定數量,即為不新增

-nname:指定新增的陰離子名稱

-nn:新增的陰離子數目

7. 能量最小化

現在,我們定義了盒子(週期性邊界條件),溶劑分子,離子。整個體系已經到達電中性。在進行模擬之前,我們必須確保體系的結構正常,原子間距離不要太近,結合構型合理。這就需要對結構進行弛豫,這一過程稱之為能量最小化(em,energy minimization),是md中非常重要的一步。

與前面類似,依然是需要用grompp來產生tpr檔案,首先要定義乙個minim.mdp檔案,定義好之後:

gmx grompp -f minim.mdp -c *.gro -p *.top -o *.tpr

-f:指定mdp檔案

-c:指定結構檔案

-p:指定拓撲檔案

-o:指定輸出的檔名

得到tpr檔案後就可以進行能量最小化了

gmx mdrun -v -deffnm em

mdrun的指令與前面一樣。

我們將得到以下檔案:

*.log 日誌檔案,記錄了能量最小化過程

*.edr 二進位制能量檔案

*.trr 全精度的二進位制軌跡檔案

*.gro 能量最小化的結構

現在,我們的體系已經處於能量最小點了,可以做一些真正的模擬了!

8. nvt平衡

nvt平衡實際上是很重要的一步,但是它的核心在於mdp檔案,而mdp檔案我將在另一篇文章中單獨闡述,因此這裡對於nvt模擬就簡化處理。

在一開始的pdb2gmx中我們生成了乙個posre.itp 檔案,這裡終於派上用場了!它的作用是對蛋白質中的重原子(非氫原子)施加位置限制力。施加限制之後,這些原子就不能隨便移動,除非能量非常大。這樣做的目的在於平衡蛋白質周圍分子的同時而不引起蛋白質結構的變化。

定義好mdp檔案後,就可以進行模擬了。

gmx grompp -f *.mdp -c *.gro -p *.top -o *.tpr

-c指定前面生成的能量最小化的結構檔案,-p依然指向那個被修改了多次的蛋白質top檔案,-o指定輸出檔案。

gmx mdrun -deffnm *

指定輸出檔名。

9. npt平衡

與nvt平衡類似,關鍵在於mdp檔案中,因此不再贅述,命令如下

gmx grompp -f *.mdp -c *.gro -t *.cpt -p *.top -o *.tpr

gmx mdrun -deffnm *

cpt為斷點檔案(check point),詳見關於檔案的文章中。

10. 成品md

現在我們的體系已經在需要的溫度和壓強下平衡(弛豫)好了,我們可以放開位置限制並進行最終的md,以收集資料了。

同樣,先定義mdp檔案,然後執行

gmx grompp -f *.mdp -c npt.gro -t npt.cpt -p *.top -o *.tpr

gmx mdrun -deffnm *

機器學習助推分子動力學模擬

今天介紹一篇文章,使用神經網路將分子動力學第一原理計算推進到新的尺度和精度。分子動力學模擬一般被用來揭示化學反應的微觀物理過程,用於光合作用,新藥尋找,奈米材料性質 等等。劉慈欣告訴我們,經典力學下的三體運動已經非常複雜,而量子力學統治下的多體相互作用,計算複雜度更是高到天際。分子動力學模擬要根據每...

分子動力學模擬 VMD多分子處理及指令碼(2)

file new molecule browse name.pdb load 將工作目錄指定到正確的路徑 cd 目錄執行模擬 mol new name.pdb和匯入晶體結構資訊一樣,但是檔案字尾為psf 在main視窗選中psf 然後右鍵,選擇load data to the molecule 出現...

LAMMPS分子動力學技術與應用

北京軟研國際資訊科技研究院 互動派 北京 教育科技 二零二零年九月一日 二零二零年九月一日 四 培訓課表 lammps分子動力學模擬技術與應用 專題線上培訓 課 程 內 容 第一天 上午 lammps基礎 1 分子動力學模擬入門理論 掌握lammps的in檔案中各命令的意義 1.1系綜理論 1.2主...