Я пытаюсь получить содержимое внутри div и метатега веб-сайта, используя метод .get_text () после метода find_all, как показано ниже:
from bs4 import BeautifulSoup as soup
#skipped some lines
names = bs_obj.find_all("div", {'class':'classname'})
for name in names:
print(name.get_text()+"\n")
Допустим, содержимое тегов divявляются
<div class="classname">content1</div>
<div class="classname">content2</div>
Мой ожидаемый результат -
content1
content2
Однако фактический результат равен
<div class="classname">content1</div>
<div class="classname">content2</div>
Я пробовал некоторые методы, такие как split()
, replace()
, re.search()
но теги не исчезнут.Есть идеи, что происходит?