Я пытаюсь вычистить обзоры продуктов с веб-сайта, используя python3 и селеновый хромедривер.
В эти обзоры включены ответы компаний (удалите их). Эти ответы компании легко идентифицируемы, потому что заголовок контента всегда «ответ компании x».
Так что я хотел бы, чтобы функция python3 была такой:
if 'response from company x' not in mydriver.find_element_by_class_name('bv_content_title').text:
search for child classes of ('bv_content_core')
append child class ('bv_content_review_text') to list
У меня проблемы с использованием родительских и дочерних отношений, связанных с "классом" в HTML. Должен ли я назвать родителя ('bv_content_core'), а затем выполнить поиск по всем дочерним классам соответствия ядра и строки? Есть ли более простой способ использовать XPath parent / childs?