Я пытался собрать данные о прилетах и вылетах внутренних рейсов с веб-сайта международного аэропорта Нью-Дели.Я перепробовал почти все, но я не могу извлечь данные.Когда я запускаю код, он ничего не возвращает. Я пробовал подобный код на другом сайте аэропорта, но это сработало.Вот код, который я написал.
res = requests.get("https://m.newdelhiairport.in/live-flight- information-all.aspx?FLMode=A&FLType=D") soup = BeautifulSoup(res.content,'html5lib') table = soup.find_all('tbody',{'class':'arr_dep_table_body'}) print(table)
Вот ссылка на сайт: - "https://m.newdelhiairport.in/live-flight-information-all.aspx?FLMode=A&FLType=D"
Скриншот сайта
Как уже упоминалось, вы можете использовать альтернативный URL-адрес, откуда поступают данные.Вам нужно будет добавить заголовок.
import requests import pandas as pd url = 'https://m.newdelhiairport.in/get-all-Fids-FlightInfo.aspx?FltType=D&FltWay=A&FltNum=&FltFrom=&rn=0.992638793938065' re = requests.get(url, headers = {'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_10_1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/39.0.2171.95 Safari/537.36'}) df = pd.read_html(re.text) print(df)
Я вытащил URL из вкладки сети.Я открыл вкладку сети и перезагрузил страницу, затем проверил веб-трафик XHR: