Кто-нибудь использовал pubchemdb?Любой подобный API? - PullRequest
1 голос
/ 09 мая 2011

Обновление: ссылка в ответе интересна и полезна, но, к сожалению, не учитывает необходимость API Java, поэтому я все еще жду каких-либо отзывов.

Я создаю базу данных химических соединений. Мне нужны все синонимы (IUPAC и общие названия), а также данные по безопасности для каждого.
Я буду использовать свободно доступные данные в PubChem (http://pubchem.ncbi.nlm.nih.gov/)

Существует простой способ запрашивать каждое соединение с помощью простых HTTP-запросов. Например, для получения данных глицерина, URL-адрес:

http://pubchem.ncbi.nlm.nih.gov/summary/summary.cgi?cid=753

И следующий URL вернет простой для анализа формат:

http://pubchem.ncbi.nlm.nih.gov/summary/summary.cgi?cid=753&disopt=DisplaySDF

но он будет отвечать только очень базовой информацией, без данных о безопасности и только нескольких распространенных имен.

Существует один общедоступный API-интерфейс для JAVA, который кажется очень полным и разработан группой из Scripps ( цитата ). Код здесь .

К сожалению, этот API не очень хорошо документирован, и его довольно сложно использовать из-за сложности используемых данных. Насколько я понял, pubchemdb использует XML-интерфейс PubChem Power User Gateway (PUG)

Кто-нибудь использовал этот API (или любой другой доступный)? Буду признателен за краткое описание или учебник о том, как начать с него.

1 Ответ

2 голосов
/ 10 мая 2011

Набор инструментов Cactvs Chemoinformatics (бесплатный для академического / образовательного использования) имеет полную интеграцию с PubChem.Используя среду сценариев, вы можете легко сделать что-то вроде

cactvs>ens create 753

ens0

cactvs>ens get ens0 E_NAMESET

PROPANE-1,2,3-TRIOL GLYCEROL 8043-29-6 29796-42-7 30049-52-6 37228-54-9 75398-78-6 78630-16-7 8013-25-0 175385-78-1 25618-55-7 64333-26-2 56-81-5 {Tegin M} LS-1377 G8773_SIGMA 15523_RIEDEL {Glycerin, natural} NCGC00090950-03 191612_ALDRICH 15524_RIEDEL {Glycerol solution} L-glycerol 49767_FLUKA {Biodiesel impurity} 49770_FLUKA 49771_FLUKA NCGC00090950-01 49927_FLUKA Glycerol-Gelatine G7757_SIAL GOL D-glycerol G9012_SIAL {Polyhydric alcohols} c0066 MOON {NSC 9230} G2025_SIGMA ZINC00895048 49781_FLUKA {Concentrated glycerin} {Concentrated glycerin (JP15)} D00028 {Glycerin (JP15/USP)} 44892U_SUPELCO {Glycerin, concentrated (JAN)} CRY 49782_FLUKA NCGC00090950-02 G6279_SIAL W252506_ALDRICH G7893_SIAL {Glycerin, concentrated} 33224_RIEDEL Bulbold Cristal Glyceol G9281_SIGMA Glycerol-1,2,3-3H G1901_SIGMA G7043_SIGMA 1,2,3-trihydroxypropane 1,2,3-trihydroxypropanol glycerin G2289_SIAL G9406_SIGMA {Glycerol-[2-3H]} CHEBI:17754 Glyzerin Oelsuess InChI=1/C3H8O3/c4-1-3(6)2-5/h3-6H,1-2H {90 Technical glycerine} Dagralax {Glycerin, anhydrous} {Glycerin, synthetic} Glycerine Glyceritol {Glycyl alcohol} Glyrol Glysanin NSC9230 Ophthalgan Osmoglyn Propanetriol {Synthetic glycerin} {Synthetic glycerine} Trihydroxypropane Vitrosupos {WLN: Q1YQ1Q} Glycerol-1,3-14C {4-01-00-02751 (Beilstein Handbook Reference)} AI3-00091 {BRN 0635685} {CCRIS 2295} {Caswell No. 469} {Citifluor AF 2} {Clyzerin, wasserfrei [German]} {EINECS 200-289-5} {EPA Pesticide Chemical Code 063507} {FEMA No. 2525} {Glicerina [DCIT]} {Glicerol [INN-Spanish]} {Glycerin (mist)} {Glycerin [JAN]} {Glycerin mist} {Glycerine mist} Glycerinum {Glycerolum [INN-Latin]} Grocolene {HSDB 492} IFP {Incorporation factor} 1,2,3-Propanetriol C00116 Optim {Propanetriol (VAN)} {1,2,3-PROPANETRIOL, HOMOPOLYMER} {Glycerol polymer} {Glycerol, polymers} {HL 80} {PGL 300} {PGL 500} {PGL 700} Polyglycerin Polyglycerine Polyglycerol {Unigly G 2} {Unigly G 6} G5516_SIGMA MolMap_000024

cactvs>

Это скрывает все безобразия PUG - но в любом случае, я осмелюсь сказать, что PUG хорошо задокументировано.Инструментарий выходит далеко за рамки простой загрузки данных - вы даже можете открыть и запросить PubChem как локальный SD-файл, если хотите.

Однако PubChem не содержит данных о безопасности.А данные по безопасности зависят от страны / региона, строго регламентированы, и вы должны быть очень осторожны, чтобы не столкнуться с обязательствами.Проверьте ваш подход юридическим персоналом!

...