Как печатать и суммировать только цифры из HTML-кода? (Python) - PullRequest
1 голос
/ 27 марта 2019

Проблема в том, что я не могу получить цифры из кода HTML.

1 Ответ

1 голос
/ 27 марта 2019
import re
from bs4 import BeautifulSoup

url = str(input())
soup = BeautifulSoup(url,"html.parser")
data = soup.find_all('td')
numbers = [d.text for d in data if d.text.isdigit()] # if the text of the td element is a number, include it in the list assigned to the variable 'numbers'
print(numbers)
>>> ['23', '40']

По сути, разбейте его на более мелкие шаги:

  • Отделите все элементы HTML, которые могут содержать данные, которые вы ищете (в данном случае, <td> элементов)

  • Для каждого из этих элементов проверьте, содержит ли он цифру, с помощью метода str.isnumber (): str.isdigit () doc

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...