Очистите страницу отеля TripAdvisor с Python - PullRequest
0 голосов
/ 19 сентября 2018

В настоящее время я строю скребок для получения отзывов и оценок.

Работает для ресторанов, но дает 400 для отелей

Вот код: https://gist.github.com/jamieaitken/e6df15db9f1204fe67c16f1404996c6f

Благодарим за любую помощь, спасибо

Ответы [ 2 ]

0 голосов
/ 20 сентября 2018

Хм, обычные запросы должны работать нормально, например:

from requests import request as req

url = 'https://www.tripadvisor.co.uk/Hotel_Review-g60745-d121009-Reviews-Holiday_Inn_Express_Boston-Boston_Massachusetts.html'
rsp = req('GET', url)

if rsp.status_code == 200:
    print(rsp.text.encode('utf-8'))
0 голосов
/ 19 сентября 2018

Ммм, почему urlNotWork и urlWorks не заключены в строки?

...