BeautifulSoup4 Python3 дает неправильные значения из ссылочной таблицы - PullRequest
0 голосов
/ 29 марта 2020

Я пытаюсь получить таблицу, появляющуюся в https://covid19.isciii.es/, используя bs4 + Python3.

table to be extracted

Когда я проверяю значения с помощью моего браузер, веб-сайт показывает те же значения

inspect table

Но код показывает мне другие значения [т.е. (71,0,0) для Андалусии вместо текущего ( 4682,405,50,45)]

url_base = 'https://covid19.isciii.es/'
response = get(url_base)
print(response)
if response.status_code == 200:
    html_soup = BeautifulSoup(get(url_base).text, 'html.parser').findAll("td")
    print(html_soup) 

execution result

Почему это происходит? Как я могу решить эту проблему с помощью BS4?

Заранее спасибо

1 Ответ

0 голосов
/ 29 марта 2020

Вы можете сделать это в 2 строки: =

import pandas as pd

df = pd.read_html("https://covid19.isciii.es/")[0]

XHR фактически дает мне другой URL, который имеет правильное значение: -

import pandas as pd

df = pd.read_csv("https://covid19.isciii.es/resources/ccaa.csv")
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...