Question

Я пытался извлечь имя из профиля в твиттере, единственная проблема, с которой я столкнулся, это то, что Beautifulsoup захватил весь элемент. Я пытался {"class":} указать элемент, но всякий раз, когда я делаю это, это приводит к получению

AttributeError: у объекта 'NoneType' нет атрибута 'text' error.

Мой код:

url = "https://twitter.com/barackobama"
html_doc = urllib.request.urlopen(url)
soup = BeautifulSoup(html_doc, 'lxml')

name = soup.find('h1').text
print(name)

Andersson · Answer 1 · 16 ноября 2018

Если вы хотите получить текст из дочерней ссылки заголовка вместо полного текста заголовка, попробуйте

url = "https://twitter.com/barackobama"
html_doc = urllib.request.urlopen(url)
soup = BeautifulSoup(html_doc, 'lxml')

name = soup.find('h1').a.text
print(name)
# 'Barack Obama'

Beautifullsoup: Как получить содержимое тега <a>, который находится внутри <h1>?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Beautifullsoup: Как получить содержимое тега <a>, который находится внутри <h1>?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Нет похожих вопросов