(Отказ от ответственности: я новичок, извините, если эта проблема действительно очевидна)
Здравствуйте,
Я создаю небольшой сценарий, чтобы сначала найти определенные частиHTML
разметка внутри локального файла и затем отображение информации без тегов HTML
.
Для этого я использовал bs4
и find_all
/ get_text
.Взгляните:
from bs4 import BeautifulSoup
with open("/Users/user1/Desktop/testdatapython.html") as fp:
soup = BeautifulSoup(fp, "lxml")
titleResults = soup.find_all('span', attrs={'class':'caption-subject'})
firstResult = titleResults[0]
firstStripped = firstResult.get_text()
print(firstStripped)
На самом деле это работает до сих пор.Но я хочу сделать это для всех значений titleResults
, а не только для первого значения.Но я не могу обработать массив с get_text
.
Каким способом было бы лучше всего это сделать?Количество значений для titleResults
всегда меняется, поскольку локальный html-файл является только примером.
Заранее спасибо!
PS Я уже искал эту связанную ветку, но это не такк сожалению, достаточно для понимания или решения проблемы:
BeautifulSoup get_text from find_all