Я пытаюсь очистить веб-сайт, и когда я пытаюсь превратить его в файл CSV, данные не попадают в правильный столбец - PullRequest
0 голосов
/ 08 мая 2018

Я новичок в веб-очистке и на практике пытаюсь веб-очистить веб-сайт и превратить результаты в CSV-файл. Когда я прихожу к части, чтобы превратить результаты в CSV-файл, он не помещает адрес в столбец адреса. Я хочу, чтобы данные попали в адресную колонку. Код выглядит следующим образом.

from urllib.request import urlopen as uReq
from bs4 import BeautifulSoup as soup

my_url = 'https://www.allagents.co.uk/find-agent/london/'

uClient = uReq(my_url)

page_html = uClient.read()

uClient.close()

page_soup = soup(page_html, 'html.parser')

containers = page_soup.findAll('div', {'class':'itemlabel3'})

filename = "webscrape.csv" 

f = open(filename, "w")

headers = "Company Name, Address, Telephone Number\n"

f.write(headers)

for container in containers:
    comp_name   = container.find('div', {'class':'labelleft2 col-md- 
10'}).div.h4.a.text

    address     = container.find('div', {'class':'labelleft2 col-md- 
   10'}).div.p.text

    tel         = container.find('div', {'class':'labelleft2 col-md- 
   10'}).div.find('p', {'style':'clear: both; margin-bottom: 
15px;'}).strong.text

    print("Company Name:", comp_name)
    print("Address:", address)
    print("Telephone", tel)

    f.write(comp_name.replace(",", ("|")) + "," + address.replace(",", ("|")) + 
"," + tel + "\n")

f.close()

Любая помощь приветствуется. Заранее спасибо.

1 Ответ

0 голосов
/ 08 мая 2018

похоже в ваших адресных данных присутствует символ новой строки

попробуйте заменить строку ниже для адреса в вашем коде и повторите попытку

address=(container.find('div', {'class':'labelleft2 col-md-10'}).div.p.text).replace('\n','')
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...