Получите данные с сайта на python - PullRequest
0 голосов
/ 22 апреля 2020

Мне нужно получить доступ к таблице с этого веб-сайта. https://www.tsa.gov/coronavirus/passenger-throughput.

Мне нужна эта таблица в виде pandas фрейма данных.

До того, как Я работал только с URL-адресами, которые уже являются xls или csv, поэтому я не знаю, как получить таблицу с обычного веб-сайта.

Помогите, пожалуйста!

1 Ответ

0 голосов
/ 22 апреля 2020

Я постараюсь указать отправную точку. Вы можете проверить официальную документацию для получения более подробной информации.

from bs4 import BeautifulSoup
from urllib.request import Request, urlopen

req = Request('https://www.tsa.gov/coronavirus/passenger-throughput',  headers={'User-Agent': 'Mozilla/5.0'})
html = urlopen(req).read()

soup = BeautifulSoup(html, 'html.parser')
for row in soup.find_all('tr'):
    print(row)

вывод выглядит так:

 <tr><td><strong>Date</strong></td><td><strong>Total Traveler Throughput</strong></td><td><strong>Total Traveler Throughput<br/>(1 Year Ago - Same Weekday)</strong></td></tr>
 <tr><td>4/21/2020</td><td>92,859</td><td>2,227,475</td></tr>
 <tr><td>4/20/2020</td><td>99,344</td><td>2,594,171</td></tr>
 <tr><td>4/19/2020</td><td>105,382</td><td>2,356,802</td></tr>
 <tr><td>4/18/2020</td><td>97,236</td><td>1,988,205</td></tr>
 <tr><td>4/17/2020</td><td>106,385</td><td>2,457,133</td></tr>
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...