Скребковый стол с красивым супом и питоном - PullRequest
0 голосов
/ 15 февраля 2019

Я хотел бы получить tr из вложенной таблицы #timeTable с этой веб-страницы .

Я пробовал следующее, но он дает пустой массив.

nlg_timetable_url = "https://navlib.forth-crs.gr/italian_b2c/npgres.exe?func=TT&ReservationType=npgres.exe%3FPM%3DBO&Leg1i=PRJ&Leg1ii=BEV&Leg1Date=26%2F02%2F2019&TotalPassengers=1&TotalPassengersHuman=1&TotalPassengersAcce=0&TotalVehicles=0"
headers = {'user-agent':'Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/62.0.3202.94 Safari/537.3'}
request = urllib.request.Request(nlg_timetable_url,headers=headers)
html = urllib.request.urlopen(request).read()
soup = BeautifulSoup(html,'html.parser')
ngl_timetable_table = list(soup.select('#timeTable tr'))
print(ngl_timetable_table)

Выход

[]

1 Ответ

0 голосов
/ 15 февраля 2019

Я бы использовал модуль запросов

import requests
from bs4 import BeautifulSoup
nlg_timetable_url = "https://navlib.forth-crs.gr/italian_b2c/npgres.exe?func=TT&ReservationType=npgres.exe%3FPM%3DBO&Leg1i=PRJ&Leg1ii=BEV&Leg1Date=26%2F02%2F2019&TotalPassengers=1&TotalPassengersHuman=1&TotalPassengersAcce=0&TotalVehicles=0"
headers = {'user-agent':'Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/62.0.3202.94 Safari/537.3'}
res = requests.get(nlg_timetable_url,headers=headers)
soup = BeautifulSoup(res.content,'html.parser')
for item in soup.select('#timeTable tr'):
    print(item.text)
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...