Обработка всех значений массива с помощью get_text - PullRequest
0 голосов
/ 30 декабря 2018

(Отказ от ответственности: я новичок, извините, если эта проблема действительно очевидна)

Здравствуйте,

Я создаю небольшой сценарий, чтобы сначала найти определенные частиHTML разметка внутри локального файла и затем отображение информации без тегов HTML.

Для этого я использовал bs4 и find_all / get_text.Взгляните:

from bs4 import BeautifulSoup
with open("/Users/user1/Desktop/testdatapython.html") as fp:
    soup = BeautifulSoup(fp, "lxml")

titleResults = soup.find_all('span', attrs={'class':'caption-subject'})

firstResult = titleResults[0]

firstStripped = firstResult.get_text()

print(firstStripped)

На самом деле это работает до сих пор.Но я хочу сделать это для всех значений titleResults, а не только для первого значения.Но я не могу обработать массив с get_text.

Каким способом было бы лучше всего это сделать?Количество значений для titleResults всегда меняется, поскольку локальный html-файл является только примером.

Заранее спасибо!

PS Я уже искал эту связанную ветку, но это не такк сожалению, достаточно для понимания или решения проблемы:

BeautifulSoup get_text from find_all

1 Ответ

0 голосов
/ 30 декабря 2018

find_all возвращает список

for result in titleResults:
    stripped = result.get_text()
    print(stripped)
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...