Pandas не распознает категориальные - обращайтесь к оригинальным кодам, когда convert_categorical = True - PullRequest
0 голосов
/ 23 сентября 2018

У меня есть файл stata .dta.Если я открою его в stata, я смогу увидеть несколько столбцов с метками значений.Я могу перейти к просмотру, щелкнуть по одному из них и увидеть оригинальный код за меткой.

Если я прочитаю этот файл .dta в python через pd.read_stata(..., convert_categoricals=True), я смогу получить типы данныхчерез df.dtypes.

Для некоторых столбцов созданы категории.Однако для одного интересного столбца вместо этого была создана серия с dtype Object, которая содержит метки в виде строки.

  1. Как именно работает процесс создания категории в pd.read_stata?
  2. Как получить доступ к исходным кодам данных за метками при чтении с помощью convert_categorical=True
  3. Что мне делать в случае, когда столбцы преобразуются в dtype Object - нужно ли мне повторно считывать данные в кадре с convert_categoricals=False и объединять?Это действительно звучит непитонично.
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...