невозможно извлечь текст из BeautifulSoup - PullRequest
0 голосов
/ 05 июля 2018

Я пытаюсь получить данные с одной из html-страниц, используя beautifulsoup и regex, но не могу это сделать.

html_data:

<td class="col-a size a-update">200 MB<span class="next-size">1250</span></td>

Я хочу извлечь только 200 МБ, но не 1250

Я пробовал ниже код:

from bs4 import BeautifulSoup

html_string = '<td class="coll-4 size mob-uploader">194.5 MB<span 
class="seeds">3422</span></td>'
soup = BeautifulSoup(html_string, 'html.parser')
size =  soup.find('td', {'class': 'size'}).getText()
print size

но я получил оба 194,5 MB3422

Пожалуйста, предложите.

1 Ответ

0 голосов
/ 05 июля 2018

Я решил с помощью кода ниже:

from bs4 import BeautifulSoup

html_string = '<td class="coll-4 size mob-uploader">194.5 MB<span 
class="seeds">3422</span></td>'
soup = BeautifulSoup(html_string, 'html.parser')
size =  soup.find('td', {'class': 'size'}).contents[0]
print size
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...