Я пытаюсь извлечь ссылки из блока p
, но я бы хотел игнорировать все, что находится в скобках.Например,
<p>
Some text (even more text <a href='link_text'>link_text</a>) another link <a href='link_text2'>link_text2</a>
</p>
Я бы хотел выбрать любые ссылки только после того, что находится в скобках, поэтому в приведенном выше случае просто ссылка link_text2
.В настоящее время я беру ссылки, используя это ...
ps = content.find_all('p', recursive=False)
for p in ps:
as = p.find_all('a', recursive=False)
Я думаю, что я должен использовать регулярное выражение, но не уверен, как включить его, чтобы он игнорировал любые ссылки в скобках.Это регулярное выражение работает для выделения чего-либо в скобках - \(.*?\)
.
Кто-нибудь может помочь?