Rdkit学习-No.1-安装与使用

2019-03-27  本文已影响0人  ZeroDesigner

RDkit的安装与使用

简介

RDkit著名的开源化学信息学工具之一,基于BSD协议,核心数据结构与算法由C++编写。支持Python2与Python3,支持KNIME,支持机器学习方面的分子描述符的产生。

安装

1:Conda模式 官方建议使用Conda进行安装与管理,Conda可以使用清华的源进行下载,安装完成后,再次更换其安装源,同样更换为清华的源。换源的教程参考 安装命令: conda install rdkit

2:Pycharm模式 Pycharm并不能直接安装RDkit,当使用上一步Conda安装完成后,将python的环境配置修改为conda的目录,即可在pycharm中使用Rdkit。

使用

1:分子的读取

from rdkit import Chem

可以从mol格式的文件中的读取分子,输入mol文件所在目录

m = Chem.MolFromMolFile('data/input.mol')

可以读取成套的sdf格式的分子文件

suppl = Chem.SDMolSupplier('data/5ht3ligs.sdf')

2:计算单个分子的原子数目

for mol in suppl:

if mol is None: continue

print(mol.GetNumAtoms())

3:Fingerprinting and Molecular Similarity

计算Topological Fingerprints

from rdkit import DataStructs

from rdkit.Chem.Fingerprints import FingerprintMols

finm=FingerprintMols.FingerprintMol(m)

fps = [FingerprintMols.FingerprintMol(x) for x in lib]

for y in range(len(lib)):

print(DataStructs.FingerprintSimilarity(finm,fps[y])

上一篇 下一篇

猜你喜欢

热点阅读