Question

Я пытаюсь очистить веб-страницу, используя html парсер и BeautifulSoup. Я пытаюсь получить текст из определенных тегов

. Но так как у некоторых из них нет текстов вообще, я получаю ошибку атрибута для тех, которые пусты. Я пытаюсь следующий код:

content = elements.find("p",{"class":"Text"}).text #Where elements is a bs4 tag inside a for loop

После некоторых итераций я получаю следующую ошибку:

AttributeError: 'NoneType' object has no attribute 'text'

Возможно, мне придется попробовать что-то вроде следующего:

while True:
    content = elements.find("p",{"class":"Text"}).text
    if type(content)==None:
        content = 'None'

Но что-то не так в приведенном выше коде

Mohit Khandelwal · Answer 1 · 01 мая 2020

Прежде чем получить доступ к свойству text элемента, вам нужно проверить, не является ли этот элемент None.

while True:
    elem = elements.find("p",{"class":"Text"})
    if elem is not None:
        content = elem.text
    else:
        content = 'None'  # Any static value you want to give

Теги от L oop до html

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Теги от L oop до html

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы