Несоответствие между моей выходной категорией pandas.cut и теми, которые показаны в документации на pandas - PullRequest
0 голосов
/ 29 августа 2018

Я изучаю pandas.cut, чтобы поместить мои данные в разные корзины. Я запускаю пример кода из документации pandas . Но почему-то категория, показанная в сгенерированных мною результатах, отличается.

Первый пример:

Tocut = np.array([1, 7, 5, 6, 4, 9])
pd.cut(Tocut, 3)

Вывод категории, который я получаю, это «Категории (3, объект): [(0.992, 3.667] <(3.667, 6.333] <(6.333, 9]]», в то время как документация показывает «Категории (3, интервал [float64]»). ): ... "</p>

Второй пример:

s = pd.Series(np.array([2, 4, 6, 8, 10]), index=['a', 'b', 'c', 'd', 'e'])
pd.cut(s, 6)

Вывод категорий, который я получаю, - «Categories (6, object):», хотя документация по-прежнему показывает float64.

Мне просто интересно, что способствует этому. И что-нибудь в Python не является объектом?

Спасибо.

1 Ответ

0 голосов
/ 29 августа 2018

Я думаю, что это может быть ошибкой, но это было исправлено. На 0.23.4 возвращается float64, как и ожидалось.

pd.cut(s, 6)

a    (1.992, 3.333]
b    (3.333, 4.667]
c      (4.667, 6.0]
d    (7.333, 8.667]
e     (8.667, 10.0]
dtype: category
Categories (6, interval[float64]): [(1.992, 3.333] < (3.333, 4.667] < (4.667, 6.0] < (6.0, 7.333] <
                                    (7.333, 8.667] < (8.667, 10.0]]

Предполагаю, что это была ошибка, связанная с нечисловым индексом во втором примере, которая каким-то образом способствовала этому.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...