Получение очищенных данных в точных столбцах и строках таблицы в Python - PullRequest
0 голосов
/ 25 апреля 2020

Я хочу собрать данные в таблицу на сайте. Я просто хочу получить данные из первого столбца в пятый столбец (округ, дела, смерти, Recov, Casws / 10k). Тем не менее, результаты не имеют названия округа (Лос-Анджелес ..). Можете ли вы помочь мне исправить мои ошибки?

# Import libraries
import pandas as pd
import csv
import requests
from bs4 import BeautifulSoup

#This function is to scrape data from a website# 
def scrape_data(url):
    response = requests.get(url, timeout=10)
    soup = BeautifulSoup(response.content, 'html.parser')

    table = soup.find_all('table')[2]

    rows = table.select('tbody > tr')

    header = [th.text.rstrip() for th in rows[0].find_all('th')[0:5]]

    with open('output.csv', 'w') as csv_file:
        writer = csv.writer(csv_file)
        writer.writerow(header)
        for row in rows[2:]:
            data = [th.text.rstrip() for th in row.find_all('td')]
            writer.writerow(data)

# Main function 
if __name__=="__main__":
        url = "https://en.wikipedia.org/wiki/2020_coronavirus_pandemic_in_California#cite_note-7"
        scrape_data(url)
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...