Я пытаюсь отсканировать подробности обзора с tripadvisor.com, но чтобы это чего-то стоило, мне нужно также иметь возможность получать оценки. Тем не менее, они приведены в изображениях вместо фактических чисел. Изображение имеет разные имена классов, например, 5-звездочное изображение имеет следующий код class="ui_bubble_rating.bubble_50
, а 1-звездное - следующее: class="ui_bubble_rating.bubble_10"
.
Мне удалось получить следующее:
In [19]: response.css('div.location-review-review-list-parts-RatingLine__bubbles--GcJvM > span').extract_first()
Out[19]: '<span class="ui_bubble_rating.bubble_40"></span>'
Однако я хотел бы получить только ui_bubble_rating.bubble_40
, поскольку это облегчит процесс.
Есть Есть ли способ, которым я могу очистить имя класса, чтобы я мог получить рейтинг?
Я пробовал его в следующем отеле, но он мог быть любым: https://www.tripadvisor.com/Hotel_Review-g188590-d6767297-Reviews-or15-XO_Hotels_Couture-Amsterdam_North_Holland_Province.html
Большое спасибо!