Как извлечь рейтинг звезды из тега - PullRequest
0 голосов
/ 29 октября 2019

Я объясню проблему, я анализирую эти обзоры (https://www.tripadvisor.it/Restaurant_Review-g187849-d15099218-Reviews-Starbucks-Milan_Lombardy.html), но я застрял на звездах.

Рейтинг звезды дается тегом (class="ui_bubble_rating bubble_10/20/etc") и присущ самой метке (10 означает 1 звезду, 20 означает 2 звезды и т. д.) Учитель сказал, что я должен сделать что-то подобное

rating__star_ <-xpathSApply(reviews_parsed, '//div[@class="ui_column is-9"]', saveXML)
rating__star_1<- xpathSApply(rating__star_ , '//span[@class="ui_bubble_rating bubble_[0-9]{2,}"]', fun = xmlAttrs)

* review_parsed - это вся страница

На первом шаге я получаю обзор в целом, а на следующем я получаю атрибут звезды рейтинга, но меняю число на нечто общее (т. Е. Получаю все атрибуты пузыря с любым номером).

Конечная цель - создать таблицу с основным столбцом, в котором указан идентификатор обзора (в целом), и другими столбцами с различными характеристиками (заголовок, текст, рейтинг и т. Д.)

ЕСЛИ ВЫУ меня есть вопрос, который я могу вам сказать. Спасибо заранее (я очень начинающий, когда вы отвечаете, считайте, что для меня все совершенно новое)

rating__star <-xpathSApply(reviews_parsed, '//div[@class="ui_column is-9"]//span[@class="ui_bubble_rating bubble_[[0-9]{2,}]"]', fun = xmlValue)

Я тоже пробовал и этоне работает, я не знаю, если это простоЛибо какая-то скобка проблема или все это

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...