Возникли проблемы с гистограммой pandas. Когда для ячеек установлено значение 4, отображается только один столбец - PullRequest
0 голосов
/ 27 мая 2020

csv['Followers'] - столбец в pandas df, содержащий 20 тыс. Строк с количеством подписчиков для каждого твита, собранного через twitter API. Я пытаюсь создать гистограмму, разделяющую данные на 4 ячейки, чтобы я мог соответствующим образом пометить каждую строку. Однако я вижу только одну полосу. Может кто-нибудь помочь с этим? Спасибо

x = csv['Followers'].astype(int)
print(x)
x.plot.hist(bins = 4)

Скриншот неудачной попытки

1 Ответ

0 голосов
/ 27 мая 2020

попробуйте значение интервала 15,25,50,75,100,200,1000, чтобы увидеть изменения.

Шаг 1: Найдите наименьшую и наибольшую точку данных. Если наименьшее и / или наибольшее число не являются целыми числами, go переходите к шагу 2. Если они целые числа, go переходите к шагу 3.

Шаг 2: немного уменьшите минимум и увеличьте максимум немного. Например, как минимум 1,2 становится 1, а как максимум 99,9 становится 100.

Шаг 3: Решите, сколько ячеек вам нужно, используя наилучшее предположение и руководящие принципы, перечисленные во вступительном параграфе выше.

Шаг 4. Разделите свой диапазон (числа в наборе данных) на размер ячейки, выбранный на шаге 3. Например, если у вас есть числа в диапазоне от 0 до 50, и вы выбрали 5 ячеек, ваша ячейка размер 50/5 = 10.

Шаг 5: Создайте границы ячейки, начав с наименьшего числа (из шагов 1 и 2) и прибавив размер ячейки из шага 4. Например, если ваше наименьшее число равен 0, а размер вашего бина равен 10, у вас будут границы бункера 0, 10, 20…

Для 10 наблюдений в наборе количество интервалов классов будет:

K = 1 + 3,322 log (10) = 4,322 ≅ 4

Для 55 наблюдений в наборе количество интервалов классов составляет:

K = 1 + 3,322 log (55) = 6,781 ≅ 7

В вашем случае

1 + 3,322 журнала (20000) = 15,2880216456 = 15 (быть ст)

см .: https://www.statisticshowto.com/choose-bin-sizes-statistics/

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...