Уменьшить пустые контейнеры в Python - PullRequest
0 голосов
/ 28 августа 2018

Я новичок в binning в python и пытаюсь создать контейнеры с ценами на недвижимость. Я хотел бы, чтобы моя последняя корзина была 4000000+, чтобы уменьшить пустые корзины.

Вот мой код:

bins = np.arange(0, 13000000, 1000000)
print(bins)
labels = pd.cut(data['PRICE'], bins, right= True)
labels = labels.value_counts().sort_index()
labels

Выход

(0, 1000000]            869
(1000000, 2000000]       88
(2000000, 3000000]       20
(3000000, 4000000]        4
(4000000, 5000000]        1
(5000000, 6000000]        1
(6000000, 7000000]        0
(7000000, 8000000]        0
(8000000, 9000000]        0
(9000000, 10000000]       0
(10000000, 11000000]      0
(11000000, 12000000]      1

Как я могу уменьшить ячейки до 4000000 и выше, чтобы иметь частоту 3?

1 Ответ

0 голосов
/ 28 августа 2018

Это должно работать здесь, вы должны вручную установить границы бина:

bins = [1000000,2000000,3000000,4000000,12000000]
print(bins)
labels = pd.cut(data['PRICE'], bins, right= True)
labels = labels.value_counts().sort_index()
labels

Также, посмотрите здесь разные ответы на эту тему:

Колонна для биннинга с питонами пандами

...