Я изучаю, как Панды изучают набор данных установки Google Play для kaggle:
https://www.kaggle.com/lava18/google-play-store-apps
Один из столбцов - «Установки», и я преобразовал значения из исходного типа объектаFloat для выполнения основной описательной статистики, но когда я смотрю на содержание:
0.000000e+00 15
1.000000e+00 67
5.000000e+00 82
1.000000e+01 386
5.000000e+01 205
1.000000e+02 719
5.000000e+02 330
1.000000e+03 907
5.000000e+03 477
1.000000e+04 1054
5.000000e+04 479
1.000000e+05 1169
5.000000e+05 539
1.000000e+06 1579
5.000000e+06 752
1.000000e+07 1252
5.000000e+07 289
1.000000e+08 409
5.000000e+08 72
1.000000e+09 58
Name: Installs, dtype: int64
Ясно, что Google не дает точное число, а скорее "мусорное ведро".
Графикс помощью этой основной команды:
apps['Installs'].plot.bar()
дает почти неразборчивое изображение.
Предложения для более удобного представления?
Предложения для графического отображения различного распределения подмножестваданные (например, только данные категории «Медицинские» приложения)?
Большое спасибо.