ошибка при очистке таблицы данных о рейсах с веб-сайта аэропорта - PullRequest
0 голосов
/ 13 декабря 2018

Я пытался собрать данные о прилетах и ​​вылетах внутренних рейсов с веб-сайта международного аэропорта Нью-Дели.Я перепробовал почти все, но я не могу извлечь данные.Когда я запускаю код, он ничего не возвращает. Я пробовал подобный код на другом сайте аэропорта, но это сработало.Вот код, который я написал.

res = requests.get("https://m.newdelhiairport.in/live-flight- information-all.aspx?FLMode=A&FLType=D")
soup = BeautifulSoup(res.content,'html5lib')
table = soup.find_all('tbody',{'class':'arr_dep_table_body'})
print(table)

Вот ссылка на сайт: - "https://m.newdelhiairport.in/live-flight-information-all.aspx?FLMode=A&FLType=D"

Скриншот сайта

1 Ответ

0 голосов
/ 13 декабря 2018

Как уже упоминалось, вы можете использовать альтернативный URL-адрес, откуда поступают данные.Вам нужно будет добавить заголовок.

import requests
import pandas as pd

url = 'https://m.newdelhiairport.in/get-all-Fids-FlightInfo.aspx?FltType=D&FltWay=A&FltNum=&FltFrom=&rn=0.992638793938065'
re = requests.get(url, headers =  {'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_10_1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/39.0.2171.95 Safari/537.36'})
df = pd.read_html(re.text)
print(df)

Я вытащил URL из вкладки сети.Я открыл вкладку сети и перезагрузил страницу, затем проверил веб-трафик XHR:

enter image description here

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...