Теги от L oop до html - PullRequest
       73

Теги от L oop до html

0 голосов
/ 01 мая 2020

Я пытаюсь очистить веб-страницу, используя html парсер и BeautifulSoup. Я пытаюсь получить текст из определенных тегов

. Но так как у некоторых из них нет текстов вообще, я получаю ошибку атрибута для тех, которые пусты. Я пытаюсь следующий код:

content = elements.find("p",{"class":"Text"}).text #Where elements is a bs4 tag inside a for loop 

После некоторых итераций я получаю следующую ошибку:

AttributeError: 'NoneType' object has no attribute 'text'

Возможно, мне придется попробовать что-то вроде следующего:

while True:
    content = elements.find("p",{"class":"Text"}).text
    if type(content)==None:
        content = 'None'

Но что-то не так в приведенном выше коде

1 Ответ

0 голосов
/ 01 мая 2020

Прежде чем получить доступ к свойству text элемента, вам нужно проверить, не является ли этот элемент None.

while True:
    elem = elements.find("p",{"class":"Text"})
    if elem is not None:
        content = elem.text
    else:
        content = 'None'  # Any static value you want to give
...