Извлечь возрастную группу и города, посещенные пользователями tripadvisor python - PullRequest
0 голосов
/ 11 октября 2018

Я изо всех сил пытаюсь выяснить возраст и количество городов, посещенных пользователем, в разделе обзора от tripadvisor, использующего python.Пожалуйста, смотрите фото.enter image description here

Пожалуйста, используйте ссылку: https://www.tripadvisor.com.au/Hotel_Review-g56003-d266157-Reviews-Magnolia_Hotel_Houston-Houston_Texas.html Не все пользователи указали свою возрастную группу.Это коды, над которыми я работал до сих пор ..

from selenium import webdriver
import time
from selenium.common.exceptions import NoSuchElementException
from selenium.webdriver.common.by import By
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
url ='https://www.tripadvisor.com.au/Hotel_Review-g56003-d266157-Reviews-Magnolia_Hotel_Houston-Houston_Texas.html'
info = browser.find_element_by_class_name('memberOverlayLink')
users_info = WebDriverWait(browser, 1).until_not(EC.visibility_of_element_located((By.ID, "memberOverlayLink")))
info.click()    
for photo in reviewBox.find_elements_by_class_name('innerContent'):
    age_group = ''
    try:
       age = photo.find_element_by_class_name("memberdescriptionReviewEnhancements li+ li")
       age_group = age.text
       age_group = ' '.join(age_group.split()[0:1])
    except NoSuchElementException:
       age_group = ''
    cities_visited = ''
    try:
       visit = photo.find_element_by_class_name("badgeTextReviewEnhancements")
       cities_visited = visit.text
       cities_visited = ' '.join(age_group.split()[0:1])
    except NoSuchElementException:
       cities_visited = ''
    close = reviewBox.find_element_by_class_name("ui_close_x")
    close.click()

Пожалуйста, кто-нибудь знает, как их очистить, направьте меня.Спасибо!

...