Как бы вы нарисовали серию поплавков панд, которые действительно обозначают категориальную переменную? - PullRequest
0 голосов
/ 27 сентября 2018

Я изучаю, как Панды изучают набор данных установки Google Play для kaggle:

https://www.kaggle.com/lava18/google-play-store-apps

Один из столбцов - «Установки», и я преобразовал значения из исходного типа объектаFloat для выполнения основной описательной статистики, но когда я смотрю на содержание:

0.000000e+00      15
1.000000e+00      67
5.000000e+00      82
1.000000e+01     386
5.000000e+01     205
1.000000e+02     719
5.000000e+02     330
1.000000e+03     907
5.000000e+03     477
1.000000e+04    1054
5.000000e+04     479
1.000000e+05    1169
5.000000e+05     539
1.000000e+06    1579
5.000000e+06     752
1.000000e+07    1252
5.000000e+07     289
1.000000e+08     409
5.000000e+08      72
1.000000e+09      58
Name: Installs, dtype: int64

Ясно, что Google не дает точное число, а скорее "мусорное ведро".

Графикс помощью этой основной команды:

apps['Installs'].plot.bar()

дает почти неразборчивое изображение.

Предложения для более удобного представления?

Предложения для графического отображения различного распределения подмножестваданные (например, только данные категории «Медицинские» приложения)?

Большое спасибо.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...