Каков наилучший способ визуально представить большой набор данных? - PullRequest
0 голосов
/ 11 апреля 2020

Данные, которые у меня есть, например, следующий DataFrame, он имеет 3 столбца: «camion» (номер грузовика), «años» (годы), «media litros» (средний литр) и 193 строки. Столбцы camion и anos не имеют уникальных значений. Грузовики ходят с 1 по 7023, шагая случайным образом, и годы включают годы с 2017 по 2020, но не обязательно все.

Код, из которого я получаю кадр данных, такой:

    valores = new[['camion','litros','año']].groupby(['camion','año']) 
    ['litros'].mean().reset_index(name = 'media litros')
    print(valores)

Я знаю, как отображать данные, но не умею отображать такие большие данные так, чтобы это имело смысл для клиента.

Образ кадра данных, который у меня есть:

data frame I have

Я не знаю, может ли это быть полезным, вот минимально воспроизводимый пример такого фрейма данных:

   import pandas as pd
   truck_id = [1,1,2,3,4,4,4,5,6,6,6,7,8,8,12,15,15,15,15,18]
   years = [2018,2020,2017,2017,2019,2018,2020,2018,2017,2019,2018,2020,2018,2020,2017,2018,2019,2020,2017,2020]
   mean = [17138.77, 13282.85, 6088.51, 15550.93, 10253.13, 19841.98, 6936.13, 7763.45, 17856.75, 12498.89, 10671.49, 10049.78, 15805.94, 10918.88, 7069.18, 5865.46, 7385.18, 9759.91, 19019.89, 9599.6]
   df = pd.DataFrame({'camion': truck_id,'year':years,'media':mean})

Данные представляют собой немного бедный, но я думаю, что вы могли бы представить структуру данных.

1 Ответ

0 голосов
/ 11 апреля 2020

Ниже приведено решение: -

import pandas as pd

# sample dataset
df = pd.DataFrame(
{'camion': [1, 1,2, 2],
'Date': [2020., 2011, 2005, 2006],
'Media Litros':[1000, 2000, 3000, 4000]
}) 

Date.  camios  Media Litros

2020.0  1      1000
2011.0  1      2000
2005.0  2      3000
2006.0  2      4000
df.groupby('camion'['MediaLitros'].plot(legend=True))

Visulization of result

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...