Очистка itemprop = "name" в BeatifulSoup в Python - PullRequest
0 голосов
/ 22 февраля 2019
names = soup.find_all('meta', itemprop='name')
prices = soup.find_all('span', class_='price product-price')

for price, name in zip(prices, names):
    modelName = name
    modelPrice = price.text
    csv_writer.writerow([modelName, modelPrice])
print('Parsing prices: DONE')
csv_file.close()

После этого кода я экспортирую его в CSV-файл и получаю что-то вроде этого:

    "
"<meta content=""TEXT HERE"" itemprop=""name"">
</meta>","
          PRICE HERE

Я хочу избавиться от экспортированного кода, мне нужно только имя и цена.Код сайта выглядит так:

<a itemprop="name" class="product-name listgrid" href="https://websitename.com" title="Name of needed model to parse</a>

1 Ответ

0 голосов
/ 22 февраля 2019

Если вам нужна только текстовая часть документа или тега, вы можете использовать метод get_text().Он возвращает весь текст в документе или под тегом в виде одной строки Unicode.

В вашем случае что-то подобное должно работать:

soup.find_all()[0].get_text()

Я думаю, что нет необходимости делатьпетля.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...