У меня есть строка HTML с несколькими тегами <em>...</em>
. Мне нужно найти все индексы этих тегов относительно строки, где все теги удалены .
Например:
from bs4 import BeautifulSoup
string = "<em>This</em> is <em>a sample</em> string"
string_without_tags = BeautifulSoup(string, "lxml").text
# [(0, 4), (8, 16)] <=> "This" and "a sample"
print(string_without_tags[:4], ", ", string_without_tags[8:16], sep="")
Думаю, я мог бы просто используйте al oop, но, может быть, есть более эффективный способ сделать то, что мне нужно?