Моя задача:
- Выберите все столбцы, в которых строки равны 0 или 1.
- Измените класс всех этих столбцов на факториальные (так как они двоичные).
В приведенном ниже случае CA + CC должно измениться на factorial
.
CA = c(1,0,1,0,1)
CB = c(1,12,21,0,7)
CC = c(1,0,1,0,1)
mydf = data.frame(CA, CB, CC)
str(mydf)
'data.frame': 5 obs. of 3 variables:
$ CA: num 1 0 1 0 1
$ CB: num 1 12 21 0 7
$ CC: num 1 0 1 0 1
Почему? Потому что эти строки в настоящее время изображены как integer
и number
вместо factors
. И я предполагаю, что некоторые ML-алгоритмы все перемешивают.