Для получения списка веб-страниц из словаря китайских иероглифов мне нужно извлечь текст, отображаемый внутри элемента <a>...</a>
сразу после элемента <span>Radical:</span>
. Вот пример кода сайта:
https://www.archchinese.com/chinese_english_dictionary.html?find=松
<br>
<span>» Radical: </span>
<a target="_archchinese" class="char-effect" style="font-family: KaiTi,STKaiti,DFKai-SB,BiauKai,Arial !important;font-size:1.5em !important;color: #0000FF !important; " href="https://www.archchinese.com/chinese_english_dictionary.html?find=木">木</a>
, из которого я хочу извлечь только «木», т.е. текст, отображаемый внутри элемента <a>...</a>
.
Я уже пробовал:
driver.find_elements_by_xpath(/html/body/div[1]/div[5]/div[2]/div[1]/div[5]/div[2]/div[2]/a[6]
, но переменная a [x] изменяется для разных страниц, в зависимости от количества ссылок, содержащихся в разделителе <div id="charDef">
, который содержит несколько переменных на каждой странице китайских иероглифов. Более того, имена атрибутов, которые я предполагаю, могут быть использованы для выделения этого <a>...</a>
элемента, таких как target, class, частичная ссылка и так далее c. кажется, что появляются во многих других элементах на странице, т.е. не являются уникальными.
В этом случае, как я могу просто заставить Selenium извлекать текст между <a>...</a>
в элементе, который появляется сразу после элемента <span>Radical:</span>