Как я могу понять, является ли тип столбца числовым или числовым категоричным? - PullRequest
0 голосов
/ 19 февраля 2020

В кадре данных, который я использую, есть столбцы категориальные и числовые. Например,

a       b
1       1
1.35    2
2.42    3
3       3

давайте подумаем, что b - числовой категориальный столбец. Но иногда некоторые индексы могут быть удалены. Так что в этом случае мне нужно заполнить индексы, которые были удалены. Если я знаю, что столбец является категоричным, то я заполню пустой столбец значением предыдущего столбца. Так как я могу понять, что столбец является категоричным или нет? Заранее спасибо.

Ответы [ 2 ]

0 голосов
/ 25 февраля 2020

Простой ответ - посмотреть на один элемент столбца через df.column.iloc[0]. Pandas будет пытаться вывести тип данных столбцов из источника данных, как только будет выведен тип данных, он будет согласован для каждой строки.

0 голосов
/ 19 февраля 2020

Столкнулся с этим сейчас, и я думаю, что это должен быть первый подход:

https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.api.types.infer_dtype.html


Вы можете проверить все уникальные значения, которые удерживаете столбец и решаете,

#List unique values in the df['name'] column
df.name.unique()

Pandas поддерживает категориальный тип данных dtype="category"

Таким образом, вы можете изменить тип столбца на категорию для использования этих знаний в дальнейших вычислениях

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...