RDKit 化合物相似性搜尋(基於Python3)

2021-08-26 05:47:16 字數 707 閱讀 2931

化合物相似性在化學資訊學和藥物發現中具有悠久的歷史,許多計算方法採用相似度測定來鑑定研究的新化合物。

本例項通過計算分子的morgan指紋進行相似性比對。

#匯入依賴包

#!/usr/bin/env python3

from rdkit.chem import allchem as ch

from rdkit.chem import draw as d

from rdkit import datastructs

#載入分子庫

suppl = ch.sdmolsupplier('drugbank.sdf')

mols = [x for x in suppl if x is not none]

len(mols) #計算分子庫分子數目

#讀入查詢分子,計算指紋

nicotine = ch.molfromsmiles('o=c(c)oc1ccccc1c(=o)o')

nicotine_fingerprint = ch.getmorganfingerprint(nicotine, 2)

#計算分子庫每個分子指紋

mols_fps = [(m, ch.getmorganfingerprint(m, 2)) for m in mols]

化合物相似性搜尋 RDKit 化合物相似性搜尋

基於python3和rdkit的化合物結構相似性搜尋 化合物相似性在化學資訊學和藥物發現中具有悠久的歷史,許多計算方法採用相似度測定來鑑定研究的新化合物。本例項通過計算分子的morgan指紋進行相似性比對。匯入依賴包 usr bin env python3 from rdkit.chem impor...

RDKit 化合物亞結構搜尋與結果輸出

假定搜尋目標化合物作為mol字串包含在稱為mols的列表中。可以在以下流程中執行部分結構搜尋,並突出顯示匹配化合物的匹配部分結構。導入庫from rdkit.chem import allchem from rdkit.chem import draw,descriptors from rdkit....

RDKit 基於隨機森林的化合物活性二分類模型

隨機森林是許多決策樹組成的模型。這個模型不僅僅是乙個森林,而且它還是隨機的,因為有兩個概念 隨機抽樣的資料點 基於要素子集拆分的節點 隨機森林背後的另乙個關鍵點是,只考慮所有特徵的子集來分割每個決策樹中的每個節點。通常,這被設定為sqrt n features 意味著在每個節點處,決策樹考慮在特徵的...