Минимум упорядоченных категориальных данных в Panda DataFrames - PullRequest
0 голосов
/ 07 февраля 2019

У меня есть Pandas DataFrame с одной серией, содержащей упорядоченные категориальные данные.Некоторое значение этой серии может отсутствовать (NaN).Я хочу получить минимум без учета NaN, но я получил странные результаты ...

Код:

raw_cat = pd.Categorical(["a", "b", "c", "a"],
                         categories=["b", "c", "d"],
                         ordered=True)
s = pd.Series(raw_cat)
raw_cat.min(numeric_only=True), s.min(numeric_only=True)

Вывод:

('b', nan)

Ожидаемый результат:

('b', 'b')

Что я неправильно понимаю?Спасибо за вашу помощь.

1 Ответ

0 голосов
/ 26 февраля 2019

Эта проблема была регрессом панд 0.24.0 и выше.Это будет правильно в Пандах 0.24.2.

https://github.com/pandas-dev/pandas/issues/25299

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...