Не уверен насчет фактических данных, но это то, что я собрал очень быстро. Если вам это нужно для перехода на веб-сайт, используйте import requests
. вам нужно добавить url = 'yourwebpagehere' page = requests.get(url)
и изменить soup
на soup = BeautifulSoup(page.text, 'lxml')
, а затем удалить переменную html
, так как это будет ненужным.
from bs4 import BeautifulSoup
import csv
html = '<div class="featuresvap _graybox clearfix"><h3><span><i class="icon-inr"></i>1.02 Crores</span><small> @ <i class="icon-inr"></i><b>7864/sq.ft</b> as per carpet area</small></h3>'
soup = BeautifulSoup(html, 'lxml')
findSpan = soup.find('span')
findB = soup.find('b')
print([findSpan.text, findB.text.replace('/sq.ft', '')])
with open('NAMEYOURFILE.csv', 'w+') as writer:
csv_writer = csv.writer(writer)
csv_writer.writerow(["First Column Name", "Second Column Name"])
csv_writer.writerow([findSpan, findB])