Я пытаюсь разобрать текст, встроенный в HTML, используя BeautifulSoup, используя атрибут «text».Играя с "find" и "findAll", я замечаю что-то странное и не могу понять, почему он так себя ведет ...
import re
import BeautifulSoup
doc = "<html><head><title>Page title</title><title>Author name</title></head>"
soup = BeautifulSoup(doc)
# find test
test1 = soup1.find('title',text=re.compile("Page"))
print test1 # Returns "Page title"
# findAll test
test2 = soup1.findAll('title',text=re.compile("Page"))
print test2 # Returns "[<title>Page title</title>, <title>Author name</title>]"
Во втором тесте парсер не должен возвращатьте же результаты, что и в первом примере?Второй тест должен возвращать все теги 'title', текст которых содержит "Page", и все же он также возвращает второй тег title.
Это ожидается или я что-то упустил?