Rdkit学习-No.1-安装与使用
RDkit的安装与使用
简介
RDkit著名的开源化学信息学工具之一,基于BSD协议,核心数据结构与算法由C++编写。支持Python2与Python3,支持KNIME,支持机器学习方面的分子描述符的产生。
安装
1:Conda模式 官方建议使用Conda进行安装与管理,Conda可以使用清华的源进行下载,安装完成后,再次更换其安装源,同样更换为清华的源。换源的教程参考 安装命令:
conda install rdkit
2:Pycharm模式 Pycharm并不能直接安装RDkit,当使用上一步Conda安装完成后,将python的环境配置修改为conda的目录,即可在pycharm中使用Rdkit。
使用
1:分子的读取
from rdkit import Chem
可以从mol格式的文件中的读取分子,输入mol文件所在目录
m = Chem.MolFromMolFile('data/input.mol')
可以读取成套的sdf格式的分子文件
suppl = Chem.SDMolSupplier('data/5ht3ligs.sdf')
2:计算单个分子的原子数目
for mol in suppl:
if mol is None: continue
print(mol.GetNumAtoms())
3:Fingerprinting and Molecular Similarity
计算Topological Fingerprints
from rdkit import DataStructs
from rdkit.Chem.Fingerprints import FingerprintMols
finm=FingerprintMols.FingerprintMol(m)
fps = [FingerprintMols.FingerprintMol(x) for x in lib]
for y in range(len(lib)):
print(DataStructs.FingerprintSimilarity(finm,fps[y])