Извлечение определенного текста из HTML-файла с помощью BeautifulSoup - PullRequest
0 голосов
/ 15 сентября 2018

У меня есть код, подобный приведенному ниже. Я использую BeautifulSoup для очистки текста в class = 'product'. Но я хотел только 2-го и 4-го значения (то есть «Продукт 2» и «Продукт 4») в моем извлеченном файле CSV. На данный момент я знаю, как извлечь все значения (т. Е. «Продукт 1», «Продукт 2», «Продукт 3», «Продукт 4»).

<body>
    <div class="product">Product 1</div>
    <div class="product">Product 2</div>
    <div class="product">Product 3</div>
    <div class="product">Product 4</div>
</body>

1 Ответ

0 голосов
/ 15 сентября 2018

find_all возвращает список, поэтому используйте индексы для получения нужных элементов

result = data_soup.find_all(attrs={"class": "product"})
print(result[1], result[3])
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...