У меня есть кадр данных pandas с категориальным столбцом, содержащим значения NaN, например ::10000
g = pd.Series(["A", "B", "C", np.nan], dtype="category")
g
0 A
1 B
2 C
3 NaN
dtype: category
Categories (3, object): [A, B, C]
В пандах NaN - это не категория, но вы можете иметь значения NaN в ваших категориальных данных. Я хочу передать этот фрейм данных в R, используя %% R в блокноте Jupyter. Категориальный столбец успешно распознается R как фактор, но этот фактор искажен, предположительно из-за значений Nan:
%%R -i g
str(g)
Factor w/ 3 levels "A","B","C": 1 2 3 0
- attr(*, "names")= chr [1:4] "0" "1" "2" "3"
print(g)
Error in as.character.factor(x) : malformed factor
Есть ли способ удостовериться, что фактор не уродлив - например, иметь
Уровень фактора NA создан автоматически?
R: 3.5.1, rpy2: 2.9.4, Python - 3