То, что я хочу получить, это 'href' с соответствующим текстом всякий раз, когда я ищу слово, имеющее ссылку href. В этом примере, если я ищу слово «over» из «div» ниже, мне нужно, чтобы оно отображало «over +« href ».
Sample of the html i used :
html '''
<div class="ez" style="" data-ft="{"tn":"*s"}">
<span><p>This is the text here</p> <a href=" my link 3 ">More</a>
<div class="bl" style="" data-ft="{"tn":"*s"}">
<span><p>Hello everybody over there</p><a href="my link 1></div><div
class="ol"...><div class="bq qr"><a> class "gh" href="my link 2"</a>
'''html
enter code here
for text_href in soup.findAll('div'):
word = text_href.text
link = text_href['href']
print(word '+' link)
for list in word:
pattern =re.compile(r'over', re.I|re.UNICODE)
matches = pattern.finditer(c)
for match in matches:
print(match) + print(link)
Таким образом, ожидаемый результат - выделить совпадение, в моем случае «оконченное», и ссылку (href), на которой находится совпадение. результат: более + «ссылка, которую я хочу получить» (это ссылка)