Здравствуйте, я никогда не работал с xml .. Может кто-нибудь помочь мне с созданием списка или словаря в python, который дает идентификатору конкретное c имя (строку) из файла xml.
Вот мой xml файл:
api.brain-map.org / api / v2 / data / query. xml? Num_rows = 10000 & start_row = 10001 && критерии = модель :: Gene, rma: : критерии, продукты [аббревиатура $ eq% 27Mouse% 27]
Я могу показать вам фрагмент:
<Response success="true" start_row="10001" num_rows="9990" total_rows="19991">
<objects>
<object>
<acronym>Hdac4</acronym>
<alias-tags>4932408F19Rik AI047285</alias-tags>
<chromosome-id>34</chromosome-id>
<ensembl-id nil="true"/>
<entrez-id>208727</entrez-id>
<genomic-reference-update-id>491928275</genomic-reference-update-id>
<homologene-id>55946</homologene-id>
<id>84010</id>
<legacy-ensembl-gene-id nil="true"/>
<name>histone deacetylase 4</name>
<organism-id>2</organism-id>
<original-name>histone deacetylase 4</original-name>
<original-symbol>Hdac4</original-symbol>
<reference-genome-id nil="true"/>
<sphinx-id>188143</sphinx-id>
<version-status>no change</version-status>
</object>
<object>
<acronym>Prss54</acronym>
<alias-tags>4931432M23Rik Klkbl4</alias-tags>
<chromosome-id>53</chromosome-id>
<ensembl-id nil="true"/>
<entrez-id>70993</entrez-id>
<genomic-reference-update-id>491928275</genomic-reference-update-id>
<homologene-id>19278</homologene-id>
<id>46834</id>
<legacy-ensembl-gene-id nil="true"/>
<name>protease, serine 54</name>
<organism-id>2</organism-id>
<original-name>protease, serine, 54</original-name>
<original-symbol>Prss54</original-symbol>
<reference-genome-id nil="true"/>
<sphinx-id>65991</sphinx-id>
<version-status>updated</version-status>
</object>
<object>
...
Итак, в конце я хочу получить словарь или список, который говорит: 208727 - это Hdac4, и это для всех в моих файлах размером 2 xml.
Так что мне нужен идентификатор entrez и оригинальный символ. файлы:
http://api.brain-map.org/api/v2/data/query.xml?num_rows=10000&start_row=1&&criteria=model :: Gene, rma :: критерии, продукты [сокращение $ eq% 27Mouse% 27]
и
http://api.brain-map.org/api/v2/data/query.xml?num_rows=10000&start_row=10001&&criteria=model :: Gene, rma :: критерии, продукты [аббревиатура $ eq% 27Mouse% 27]
Может кто-нибудь помочь мне с этим? Я не уверен, в каком формате мне следует его хранить. В конце я хочу найти идентификатор и получить оригинальное имя.