Я новичок в python и pandas. У меня возникли трудности с отображением столбца с количеством дней, прошедших с момента возникновения первого случая по стране. Подобно столбцу даты, но вместо даты мне нужны дни, прошедшие с момента первого случая (поскольку первый случай заболевания / смерти / выздоровления в пределах страны)
Я сгруппировал данные по стране и дате и просуммировал подтвержденные, смертельные и вылеченные случаи. (Поскольку в исходных данных некоторые страны были разделены на регионы) Я также стер дни, когда не было смертей, выздоровлений или смертей (я хочу посчитать с момента появления первого случая).
Буду признателен за любую помощь! Заранее спасибо!
covid_data = covid_data.groupby(['Country/Region', 'Date'])[['Confirmed', 'Deaths', 'Recovered']].apply(sum)
covid_data.sort_values(by=['Country/Region', 'Date'])
covid_data.reset_index()
covid_data = covid_data[(covid_data.T != 0).any()] #eliminates rows with no suspected, no deaths and no cured
Вывод:
Country/Region Date Confirmed Deaths Recovered
Afghanistan 2020-02-24 1 0 0
2020-02-25 1 0 0
2020-02-26 1 0 0
2020-02-27 1 0 0
2020-02-28 1 0 0
2020-02-29 1 0 0
2020-03-01 1 0 0
2020-03-02 1 0 0
2020-03-03 1 0 0
2020-03-04 1 0 0
(and many other countries)