Я пытаюсь получить заголовки комментариев Booking.com с этого сайта:
https://www.booking.com/reviews/co/hotel/ibis-bogota-museo.es.html?page=1;r_lang=all;rows=75,
, где r_lang=all
в основном говорит, что на сайте должны отображаться комментарии на всех языках.
Чтобы получить заголовки с этой страницы, я делаю это:
from urllib.request import urlopen
from bs4 import BeautifulSoup
page = urlopen(url)
soup = BeautifulSoup(page)
reviews = soup.findAll("li", {"class": "review_item clearfix "})
for review in reviews:
print(review.find("div", {"class": "review_item_header_content"}).text)
На веб-сайте (см. Скриншот) первые два заголовка должны быть «Sencillamente placentera» и «Это моглобыло здорово. "Тем не менее, почему-то URL загружает комментарии только на испанском: «Sencillamente placentera»
«La atención de la chica del Restaurante»
«El desayuno estilo шведский стол, полностью»
«Мне приятно, ubicación, y la vista».
«Su ubicación es muy buena».
Я заметил, что если в URL-адресе я изменю «museo.es».на 'museo.en.', я получаю заголовки английских комментариев.Но это противоречиво, потому что, если я загружаю исходный URL, я получаю комментарии на английском, французском, испанском и т. Д. Как я могу это исправить?Спасибо
![enter image description here](https://i.stack.imgur.com/11BaP.png)