import urllib
from urllib import request
from bs4 import BeautifulSoup
url = 'http://mygene.info/v3/query?q=symbol:CDK2&species:human&fields=name,symbol,entrezgene'
html = request.urlopen(url).read()
soup = BeautifulSoup(html)
Выход:
<html><body><p>{
"max_score": 88.84169,
"took": 6,
"total": 244,
"hits": [
{
"_id": "1017",
"_score": 88.84169,
"entrezgene": "1017",
"name": "cyclin dependent kinase 2",
"symbol": "CDK2"
},
{
"_id": "12566",
"_score": 73.8155,
"entrezgene": "12566",
"name": "cyclin-dependent kinase 2",
"symbol": "Cdk2"
},
{
"_id": "362817",
"_score": 62.09322,
"entrezgene": "362817",
"name": "cyclin dependent kinase 2",
"symbol": "Cdk2"
}
]
}</p></body></html>
Цель :
Из этого вывода я бы хотел разобрать значения entrezgene
, name
и symbol
Вопрос :
Как мне добиться этого?
Справка:
Я попытался https://www.crummy.com/software/BeautifulSoup/bs4/doc/#searching-by-css-class и Python BeautifulSoup извлечь текст между элементами , чтобы назвать пару, но я не смог найти то, что я ищу