Соскоб класса имени изображения Scrapy - PullRequest
0 голосов
/ 16 апреля 2020

Я пытаюсь отсканировать подробности обзора с tripadvisor.com, но чтобы это чего-то стоило, мне нужно также иметь возможность получать оценки. Тем не менее, они приведены в изображениях вместо фактических чисел. Изображение имеет разные имена классов, например, 5-звездочное изображение имеет следующий код class="ui_bubble_rating.bubble_50, а 1-звездное - следующее: class="ui_bubble_rating.bubble_10".

Мне удалось получить следующее:

In [19]: response.css('div.location-review-review-list-parts-RatingLine__bubbles--GcJvM > span').extract_first()                                                                                            
Out[19]: '<span class="ui_bubble_rating.bubble_40"></span>'

Однако я хотел бы получить только ui_bubble_rating.bubble_40, поскольку это облегчит процесс.

Есть Есть ли способ, которым я могу очистить имя класса, чтобы я мог получить рейтинг?

Я пробовал его в следующем отеле, но он мог быть любым: https://www.tripadvisor.com/Hotel_Review-g188590-d6767297-Reviews-or15-XO_Hotels_Couture-Amsterdam_North_Holland_Province.html

Большое спасибо!

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...