Найти множество уникальных фрагментов с DrawMorganBits - PullRequest
0 голосов
/ 16 апреля 2019

Я тренирую случайный лес с помощью scikit-learn по отпечаткам пальцев Моргана и хотел бы знать, какие структурные мотивы наиболее важны. Для этого я хотел бы нарисовать все фрагменты, которые производят бит в x наиболее важных функциях.

Я обнаружил модуль Draw.DrawMorganBits в новой версии и эти примеры для использования: https://iwatobipen.wordpress.com/2018/11/07/visualize-important-features-of-machine-leaning-rdkit/ http://rdkit.blogspot.com/2018/10/using-new-fingerprint-bit-rendering-code.html

Однако я не знаю, как создать уникальный набор фрагментов. Ранее я прошел тестовый набор, собрал битовую информацию и молекулярные среды и создал SMILES с Chem.MolFragmentToSmiles. Затем я создал мол из набора этих улыбок и нанес их на график. Однако это слабое представление об окружающей среде, и некоторые фрагменты не могут быть нанесены на график. Я могу предоставить свой старый код. Следует старой документации https://rdkit.readthedocs.io/en/release_2017_03_1/GettingStartedInPython.html#explaining-bits-from-morgan-fingerprints

...