RDKit | 操作与实践

RDKit|分子修改与编辑

2020-05-24  本文已影响0人  最会设计的科研狗

文章目录

  1. 氢原子显示与隐藏
  2. 芳香键与kekule式转换
  1. Atom和Bond对象的编辑功能
  2. RWMol类的编辑功能

一、初级篇

1.氢原子显示与隐藏

正常情况下,分子在rdkit中存储时,氢以隐式氢的形式存储,即不会在图片中显示出来。当需要加入氢原子时,例如要生成和优化立体结构,可以通过函数加上氢原子。

>>> from rdkit import Chem
>>> m = Chem.MolFromSmiles('CCO')
>>> print(m.GetNumAtoms())
3
>>> m2 = Chem.AddHs(m)
>>> print(m2.GetNumAtoms())
9
>>> m2 = Chem.RemoveHs(m2)
>>> print(m2.GetNumAtoms())
3

2.芳香键与kekule式转换

>>> m = Chem.MolFromSmiles('c1ccccc1')
>>> print(m.GetBondWithIdx(0).GetBondType())
AROMATIC
>>> Chem.Kekulize(m)
>>> print(m.GetBondWithIdx(0).GetBondType())
DOUBLE
>>> print(m.GetBondWithIdx(1).GetBondType())
SINGLE

转化后,类型中虽然变为单键和双键,但依然是芳香键

>>> print(m.GetBondWithIdx(1).GetIsAromatic())
True
>>> Chem.Kekulize(m, clearAromaticFlags=True)
>>> print(m.GetBondWithIdx(0).GetBondType())
DOUBLE
>>> print(m.GetBondWithIdx(1).GetIsAromatic())
False
>>> Chem.SanitizeMol(m)
>>> print(m.GetBondWithIdx(0).GetBondType())
AROMATIC

二、高级篇

1.Atom和Bond对象的编辑功能

在rdkit的Atom对象中也提供了一系列功能,可以对分子进行原位编辑。

Bond对象类似

不挨个说明了,感兴趣可以试试各个函数及相关参数,举几个可能会遇到的例子

>>> m = Chem.MolFromSmiles('OC(N)C')
>>> m.GetAtomWithIdx(1).SetChiralTag(Chem.ChiralType.CHI_TETRAHEDRAL_CW)
>>> m
modifying_mols_0.png
>>> m = Chem.MolFromSmiles('c1ccccc1')
>>> m.GetAtomWithIdx(0).SetAtomicNum(7)
>>> Chem.SanitizeMol(m)
>>> Chem.MolToSmiles(m)
'c1ccncc1'
>>> m = Chem.MolFromSmiles('c1ccccc1')
>>> m.GetAtomWithIdx(0).SetAtomicNum(8)
>>> Chem.MolToSmiles(m)
'c1ccocc1'
>>> Chem.SanitizeMol(m)
---------------------------------------------------------------------------
KekulizeException                         Traceback (most recent call last)
<ipython-input-80-8aabfab76642> in <module>
----> 1 Chem.SanitizeMol(m)

KekulizeException: Can't kekulize mol.  Unkekulized atoms: 1 2 3 4 5

2.RWMol类的编辑功能

更复杂的操作可以使用rdkit.Chem.rdchem.RWMol类(用于分子读写的类)。这个类在修改分子方面,性能更好,它可以提供一个“活动的”分子,并且共享了mol对象的操作接口。修改完毕后,只需要用GetMol()就可以获得最终的分子

>>> m = Chem.MolFromSmiles('CC(=O)C=CC=C')
>>> mw = Chem.RWMol(m)
>>> mw
modifying_mols_1.png
>>> mw.ReplaceAtom(4, Chem.Atom(7))
>>> mw
modifying_mols_2.png
>>> mw.AddAtom(Chem.Atom(6))
>>> mw.AddAtom(Chem.Atom(6))
>>> mw
modifying_mols_3.png
>>> mw.AddBond(6, 7, Chem.BondType.SINGLE)
>>> mw.AddBond(7, 8, Chem.BondType.DOUBLE)
>>> mw.AddBond(8, 3, Chem.BondType.SINGLE)
>>> mw
modifying_mols_4.png
>>> mw.RemoveAtom(0)
>>> mw
modifying_mols_5.png
>>> print(Chem.MolToSmiles(mw))
O=CC1=NC=CC=C1
>>> print(Chem.SanitizeMol(mw))
SANITIZE_NONE
>>> print(Chem.MolToSmiles(mw))
O=Cc1ccccn1
>>> m_edit = mw.GetMol()
>>> type(m_edit)
rdkit.Chem.rdchem.Mol

本文参考自rdkit官方文档
代码及源文件在这里

上一篇下一篇

猜你喜欢

热点阅读