Я пытаюсь написать код с селеном python. Я работаю на сайте, как https://www.thewatchcartoononline.tv/anime/south-park-season-1. Как видите, эта страница является страницей сериала со ссылками на все эпизоды сериала. Я хочу получить ссылку на данный эпизод (пользователь выбирает, какой из них).
Важно отметить, что не каждая страница серии имеет одинаковый формат именования для эпизодов, в некоторых сериях есть только «Эпизод 1» в текст ссылки, другие могут иметь в ссылке «эпизод 1 Южного парка 1», поэтому я не могу рассчитывать на формат имен текста ссылки.
это код, который я использовал для получения ссылки на эпизод (episode_num
предоставляется пользователем)
episode_num = 1
chrome_driver = Chrome()
chrome_driver.get("https://www.thewatchcartoononline.tv/anime/south-park-season-1")
# This xpath takes you to the div of the episode list and then it search for a link which has a certain text in it
links = chrome_driver.find_elements_by_xpath(
f"//*[@id='sidebar_right3']//"
f"a[contains(text(), 'Episode {episode_num}')]"
)
Однако, когда я проверяю links
, я вижу, что существует более одной ссылки. Я получаю и эпизод 1, и эпизод 10 (поскольку оба они содержат строку «Эпизод 1»). Можно ли получить только нужную ссылку? (возможно, чтобы заставить селен взять ссылку, которая не имеет никакого ди git после текста, который я хочу)