Я пытаюсь очистить веб-страницу и сохранить результаты в файле csv / excel.Я использую красивый суп для этого.
Я пытаюсь извлечь данные из супа, используя функцию find_all, но я не уверен, как захватить данные в имени или названии поля
HTML-файл имеет следующий формат
<h3 class="font20">
<span itemprop="position">36.</span>
<a class="font20 c_name_head weight700 detail_page"
href="/companies/view/1033/nimblechapps-pvt-ltd" target="_blank"
title="Nimblechapps Pvt. Ltd.">
<span itemprop="name">Nimblechapps Pvt. Ltd. </span>
</a> </h3>
Пока это мой код.Не уверен, как действовать дальше
from bs4 import BeautifulSoup as BS
import requests
page = 'https://www.goodfirms.co/directory/platform/app-development/iphone?
page=2'
res = requests.get(page)
cont = BS(res.content, "html.parser")
names = cont.find_all(class_ = 'font20 c_name_head weight700 detail_page')
names = cont.find_all('a' , attrs = {'class':'font20 c_name_head weight700
detail_page'})
Я попытался использовать следующее -
Input: cont.h3.a.span
Output: <span itemprop="name">Nimblechapps Pvt. Ltd.</span>
Я хочу извлечь название компании - "Nimblechapps Pvt. Ltd."