Как импортировать таблицу из Интернета в Python, используя HTML? - PullRequest
0 голосов
/ 08 мая 2018

Я пытаюсь импортировать следующую таблицу в Python:

https://www.sports -reference.com / CBB / игроков / Ландри-поля-1.html # players_advanced :: нет

Когда я нажимаю «поделиться и больше», а затем «Вставить эту таблицу», я получаю URL-адрес html-кода, но я не уверен, как его использовать для извлечения интересующих меня данных. Я думая, что я мог бы использовать красивый суп, но было бы легче получить таблицу в формате csv (или преобразовать из html в csv, что я не знаю, как сделать) и импортировать ее непосредственно как фрейм данных Panda.

Большое спасибо! Том

1 Ответ

0 голосов
/ 08 мая 2018

Не уверен, что я вас неправильно понял, но эта таблица, которую вы связали, предоставляет возможность экспортировать как CSV (чуть ниже опции для встраивания в HTML-таблицу). Если вы просто хотите работать с данными, этого должно хватить для импорта в Pandas DataFrame:

import pandas as pd
df = pd.read_csv('./downloaded_data.csv')

Однако, если вы хотите загрузить прямо из HTML, вы можете просто использовать метод pandas read_html:

import pandas as pd
df = pd.read_html('https://www.sports-reference.com/cbb/players/landry-fields-1.html#players_advanced::none')
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...