Как создать график отфильтрованных значений из файла CSV? - PullRequest
0 голосов
/ 03 апреля 2020

Я пытаюсь создать график отфильтрованных значений из файла CSV. По сути, мне нужно отфильтровать все данные из этого набора данных: https://data.humdata.org/dataset/novel-coronavirus-2019-ncov-cases# и подсчитать, сколько случаев заболевания коронавирусом существует в каждой стране (США, Китай, Италия, Германия и Иран), затем создайте график для каждой страны, сравнивая количество случаев (ось Y) с датой (ось X).

До сих пор я был в состоянии отфильтровать данные и распечатать каждую строку, содержащую количество случаев для этого определенного c местоположения. Я не смог подсчитать общую сумму по каждой стране или создать график, который имеет смысл.

Вот мой код:

import matplotlib.pyplot as plt
import numpy as np
import pandas as pd



data = pd.read_csv(r'C:*****')

countries = ['China', 'Italy', 'Germany', 'Iran', 'US']
filtered_data = data[data['Country/Region'].isin(countries)]


wanted_values = filtered_data[['Country/Region','1/22/2020','1/23/2020','1/24/2020', 
 '1/25/2020','1/26/2020','1/27/2020','1/28/2020','1/28/2020','1/29/2020',


 '1/30/2020','1/31/2020','2/1/2020','2/2/2020','2/3/2020','2/4/2020','2/5/2020','2/6/2020',
  '2/7/2020',  '2/8/2020','2/9/2020','2/10/2020',
  '2/11/2020','2/12/2020','2/13/2020','2/14/2020','2/15/2020',
  '2/16/2020','2/17/2020','2/18/2020','2/19/2020','2/20/2020','2/21/2020',
  '2/22/2020','2/23/2020',
'2/24/2020','2/25/2020','2/26/2020','2/27/2020','2/28/2020','2/29/2020','3/1/2020',
'3/2/2020','3/3/2020','3/4/2020','3/5/2020','3/6/2020','3/7/2020',
'3/8/2020','3/9/2020','3/10/2020','3/11/2020','3/12/2020','3/13/2020','3/14/2020',
'3/15/2020','3/16/2020','3/17/2020','3/18/2020','3/19/2020',
'3/20/2020','3/21/2020']]


 print(wanted_values.iloc[0])
 print(wanted_values.iloc[1])
 print(wanted_values.iloc[282])

Есть 283 строки данных это было отфильтровано из исходного файла CSV, отсюда iloc [282].

Я не слишком уверен, где go отсюда, чтобы иметь возможность составить график количества случаев и даты для каждой страны / региона.

Вот скриншот того, как выглядит набор данных.

...