Я пытаюсь веб-очистить веб-сайт ( Вот ссылка на веб-сайт ), но у div на странице, кажется, есть несколько атрибутов класса, что затрудняет мне очистку данных. Я пытался найти исторические вопросы, опубликованные в Stackoverflow, но не смог найти ответ, который хотел. Ниже приведена часть кода, который я извлек с сайта:
<div data-reactid="118">
<div class="ue-ga base_ ue-jk" style="margin-left:-24px;margin-bottom:;" data-reactid="119">
<div style="display: flex; flex-direction: column; width: 100%; padding-left: 24px;" data-reactid="120">
<div class="ue-a3 ue-ap ue-a6 ue-gb ue-ah ue-n ue-f5 ue-ec ue-gc ue-gd ue-ge ue-gf base_ ue-jv ue-gz ue-h0 ue-h1" data-reactid="121">
<div class="ue-a6 ue-bz ue-gb ue-ah ue-gg ue-gh ue-gi" data-reactid="122">
<div class="ue-bn ue-bo ue-cc ue-bq ue-g9 ue-bs" title="Want to extract this part" data-reactid="123">
Want to extract this part
</div>
</div>
</div>
</div>
</div>
</div>
Что я хочу извлечь, так это текст, где написано " Хотите извлечь эту часть ". Я действительно думал о том, чтобы очистить данные с помощью данных, но разные страницы имеют разные номера данных, поэтому это не очень хорошая идея. Я также хочу сообщить, что имена классов не являются уникальными.
Кто-нибудь может мне помочь? Очень признателен.