Question

Я пытаюсь разделить эту переменную numeri c на три категории, но после объединения я получил много NaN. Может ли кто-нибудь сказать мне, как решить эту проблему.

Корзина должна быть

1-2000
2000-8000
8000-35797

Код:

df_all['df_newcol'] = pd.cut(df.sales, bins = [1, 2000, 8000,35797], labels=['Low', 'Mid', 'High'])
df_all['df_newcol']

0           NaN
1           NaN
2           NaN
3          High
4          High
           ... 
3968995     NaN
3968996     NaN
3968997     NaN

Valdi_Bo · Answer 1 · 12 июля 2020

Я создал следующий исходный DataFrame ( df ):

Биннинг только возвращает:

10     Low
12     Low
14     Mid
16     Mid
18     Mid
20    High
22    High
Name: sales, dtype: category
Categories (3, object): [Low < Mid < High]

Пока , ОК.

Затем я определил df_all со следующим содержимым:

Обратите внимание, что он:

содержит некоторые дополнительные "значения индекса (отсутствуют в df ),
действительно ли не содержат некоторые значения индекса из df (а именно 20 и 22 * 1032 *).

Теперь, когда вы сохраняете результат объединения в df_all и распечатываете новый столбец, результат будет:

8     NaN
10    Low
11    NaN
12    Low
13    NaN
14    Mid
16    Mid
17    NaN
18    Mid
19    NaN
30    NaN
32    NaN
Name: df_newcol, dtype: category
Categories (3, object): [Low < Mid < High]

Как видите, содержит некоторые NaN s.

Причина в том, что результат cut равен скорректировано по индексу целевого DataFrame, например:

Строки с ключами, отсутствующими в df receive NaN .
Значения с ключами, отсутствующими в df_all , теряются.

И, наверное, так и случилось написано в вашем окружении. Очевидно, df_all содержит некоторые дополнительные индексы по сравнению с df , и им было дано NaN s.

Edit

df может также содержать значения вне данного набора ячеек, и результат объединения для таких строк будет также NaN .

Преобразование переменной numeri c в категориальную, но, похоже, имеет много NaN

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Edit

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Преобразование переменной numeri c в категориальную, но, похоже, имеет много NaN

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Edit

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Нет похожих вопросов