Как преобразовать категориальные переменные в Python в фактор-переменную в R?(Ретикуло) - PullRequest
0 голосов
/ 16 января 2019

Я использую reticulate, чтобы преобразовать сохраненный Python .pkl в R-фрейм данных. Я вижу, что категорический тип Python хранится в R-кадре. Я предполагаю, что R не знает, как обращаться с категориальными переменными Python. Как мне преобразовать их в факторные переменные в R?

#Looking at the class of some of the variables in the R dataframe, I get

class(df$variable)

$variable
[1] "pandas.core.arrays.categorical.Categorical" 
"pandas.core.arrays.base.ExtensionArray"    
[3] "pandas.core.base.PandasObject"              
"pandas.core.base.StringMixin"              
[5] "pandas.core.accessor.DirNamesMixin"         "python.builtin.object"      

#I get the right levels, but this doesn't seem to be R-friendly 

> table(levels(factor(as.character(df$varibale))))

[level 1, level 2, level 3, level 4, level 5, ..., NaN, NaN, NaN, NaN, 
NaN]\nLength: 464121\nCategories (6, object): [level 1 < level 2 < level 3 
< level 4 < level 5 < level 6] 
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...