Как найти конкретную ссылку на странице через аналогичную строку в Python bs4 - PullRequest
0 голосов
/ 29 мая 2019

Есть ли способ найти найденную ссылку, содержащую строку этого примера Top 100 Club Tracks Vol.1 2019.rar

, но, возможно, ссылка содержит строку этого типа

Top_100_Club_Tracks_Vol.1_2019.rar (в верхнем регистре и _)

top 100 club tracks vol.1 2019.rar (строчные и пробельные символы)

top.100.club.tracks.vol1.2019.rar (строчные и точечные)

Я просто попробую этот код, и он не может просто найти ссылки, содержащие определенную строку:

mystr = Top 100 Club Tracks Vol.1 2019.rar

 links = soup_music.find('a', text=Title).findNext("div",{"class":"postContent"}).findAll('a', attrs={'href':re.compile(mystr)})

1 Ответ

0 голосов
/ 30 мая 2019

Предполагая, что он находится в теге a, который вы можете использовать * содержит оператор и передать список строк Or в select

soup.select('[href*="Top 100 Club Tracks Vol.1 2019.rar"],[href*="top 100 club tracks vol.1 2019.rar"]')

продолжайте добавлять варианты, разделенные запятыми, чтобы выбрать, как показано выше.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...