Я не получаю полную таблицу html с read_html - PullRequest
0 голосов
/ 09 апреля 2020

Я пытался получить информацию из таблицы на веб-странице, используя Panda, но она не выбрасывает мне всю информацию и другие способы, и я тоже не могу.

import pandas as pd
calls_df = pd.read_html("https://google.com/covid19-map/?hl=es-419", index_col=1,
                        attrs={"class":"SAGQRd"})
df = pd.DataFrame(calls_df)
print(calls_df)

Я пробовал код с другими ссылками, и если они получают информацию из таблиц, в чем моя ошибка?

Ответы [ 2 ]

0 голосов
/ 09 апреля 2020

pandas, возможно, не лучший способ получить данные html, попробуйте использовать модуль BeautifulSoup из: https://www.crummy.com/software/BeautifulSoup/bs4/doc/

, чтобы загрузить html в df, попробуй:

`import pandas as pd
 from bs4 import BeautifulSoup
 soup = BeautifulSoup(html, "html.parser")
 table = soup.find('table', attrs={'class':'subs noBorders evenRows'})
 table_rows = table.find_all('tr')`

 `res = []
 for tr in table_rows:
      td = tr.find_all('td')
      row = [tr.text.strip() for tr in td if tr.text.strip()]
      if row:
          res.append(row)

 df = pd.DataFrame(res, columns=["Year", "Mintage", "Quality", "Price"])
 print(df)`
0 голосов
/ 09 апреля 2020

jupyter_code_check

Эй,

Я только что проверил ваш код с помощью jupyter, и он сработал для меня. Вы также работаете с Jupyter? Возможно, кэш немного заполнен: D Перезагрузите IDE или компьютер

мои настройки:

Python 3.7.4

Имя: pandas Версия: 0.25.1

Имя: jupyter Версия: 1.0.0

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...