Я не знаю как работать с sdf файлом - PullRequest
0 голосов
/ 07 января 2020

Мне дали файл sdf для работы. Файл содержит молекулы с их свойствами, и моей задачей было бы найти их общее количество. До сих пор я работал только с sql файлами, которые я запрашиваю через pgadmin. Я должен сказать, что мой поиск в Google не был очень плодотворным, так как я пробовал онлайн-конвертеры, которые не работали, или посты, которые были слишком старыми, чтобы все еще работать.

Так что мой вопрос в основном, как кто-то работать с файлом в формате sdf? Можно ли преобразовать его в sql файл дампа, чтобы я мог запросить его? Есть ли другой способ сделать это?

Заранее спасибо!

1 Ответ

1 голос
/ 07 января 2020

Если вы имеете дело с химическими структурами / биоинформатикой, то, скорее всего, ниже приведен ответ, который поможет вам начать .

Для получения более подробной помощи я настоятельно рекомендую вам опубликовать вопрос на бирже химии Stackexchange (https://chemistry.stackexchange.com/).

Один файл MOL одна химическая структура. Например, Benzoi c acid и его файл MOL для, как показано ниже. enter image description here enter image description here

См. Анатомию файла MOL здесь . Как вы можете видеть его в текстовом файле.

Теперь, когда вы знаете файл MOL, SDF (файл структурных данных) - это не что иное, как множество файлов mol, соединенных вместе. Смотрите ссылку здесь . Файл SDF также является открытым текстом.

Я думаю, что будет трудно выровнять его по SQL, но как только вы поймете, что означает каждая строка файла SDF (и если в вашем файле SDF есть непротиворечивый шаблон ) тогда вы сможете проанализировать его и сохранить в соответствующих столбцах SQL.

Вы конвертируете весь файл в текст и сохраняете его, но, думаю, осмысленный запрос будет сложным. Так что лучше разобрать.

Пожалуйста, дайте мне знать, если вам нужна дополнительная помощь.

...