Question

Я изучаю, как Панды изучают набор данных установки Google Play для kaggle:

https://www.kaggle.com/lava18/google-play-store-apps

Один из столбцов - «Установки», и я преобразовал значения из исходного типа объектаFloat для выполнения основной описательной статистики, но когда я смотрю на содержание:

0.000000e+00      15
1.000000e+00      67
5.000000e+00      82
1.000000e+01     386
5.000000e+01     205
1.000000e+02     719
5.000000e+02     330
1.000000e+03     907
5.000000e+03     477
1.000000e+04    1054
5.000000e+04     479
1.000000e+05    1169
5.000000e+05     539
1.000000e+06    1579
5.000000e+06     752
1.000000e+07    1252
5.000000e+07     289
1.000000e+08     409
5.000000e+08      72
1.000000e+09      58
Name: Installs, dtype: int64

Ясно, что Google не дает точное число, а скорее "мусорное ведро".

Графикс помощью этой основной команды:

apps['Installs'].plot.bar()

дает почти неразборчивое изображение.

Предложения для более удобного представления?

Предложения для графического отображения различного распределения подмножестваданные (например, только данные категории «Медицинские» приложения)?

Большое спасибо.

Как бы вы нарисовали серию поплавков панд, которые действительно обозначают категориальную переменную?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Как бы вы нарисовали серию поплавков панд, которые действительно обозначают категориальную переменную?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Нет похожих вопросов