pythonbg 27 марта 2019 12

Как печатать и суммировать только цифры из HTML-кода? (Python)

1 Ответ

n1c9 / 27 марта 2019

import re
from bs4 import BeautifulSoup

url = str(input())
soup = BeautifulSoup(url,"html.parser")
data = soup.find_all('td')
numbers = [d.text for d in data if d.text.isdigit()] # if the text of the td element is a number, include it in the list assigned to the variable 'numbers'
print(numbers)
>>> ['23', '40']

По сути, разбейте его на более мелкие шаги:

Отделите все элементы HTML, которые могут содержать данные, которые вы ищете (в данном случае, <td> элементов)
Для каждого из этих элементов проверьте, содержит ли он цифру, с помощью метода str.isnumber (): str.isdigit () doc

...