Предельные уровни трансформации от int к фактору - PullRequest
0 голосов
/ 02 декабря 2018

У меня есть столбец int со значениями int.Я хотел бы преобразовать его в фактор с предопределенным количеством сегментов / уровней / поддиапазонов.Вот пример:

dat1 <- fread('https://archive.ics.uci.edu/ml/machine-learning-databases/haberman/haberman.data',stringsAsFactors=T)
dat1 <- data.frame(lapply(dat1, as.factor))
> str (dat1)
'data.frame':   306 obs. of  4 variables:
 $ V1: Factor w/ 49 levels "30","31","33",..: 1 1 1 2 2 3 3 4 4 4 ...
 $ V2: Factor w/ 12 levels "58","59","60",..: 7 5 8 2 8 1 3 2 9 1 ...
 $ V3: Factor w/ 31 levels "0","1","2","3",..: 2 4 1 3 5 11 1 1 10 28 ...
 $ V4: Factor w/ 2 levels "1","2": 1 1 1 1 1 1 1 2 2 1 ...

Я хотел бы разделить источник dat1$V3 Допустим, диапазоны (каждый уровень).Каждое из исходных значений будет относиться к одной из этих категорий.

1 Ответ

0 голосов
/ 02 декабря 2018

Использование -

dat1$V3_cut <- cut(as.numeric(dat1$V3), 5)

Выход

  V1 V2 V3 V4   V3_cut
1 30 64  1  1 (0.97,7]
2 30 62  3  1 (0.97,7]
3 30 65  0  1 (0.97,7]
4 31 59  2  1 (0.97,7]
5 31 65  4  1 (0.97,7]
6 33 58 10  1   (7,13]

или

dat1$V3_cut <- cut(as.numeric(dat1$V3), c(0,3,5,11))

Выход

  V1 V2 V3 V4 V3_cut
1 30 64  1  1  (0,3]
2 30 62  3  1  (3,5]
3 30 65  0  1  (0,3]
4 31 59  2  1  (0,3]
5 31 65  4  1  (3,5]
6 33 58 10  1 (5,11]

Вы можете либо указать число cut, либо предоставить список, состоящий из границ класса.По умолчанию include.lowest равно FALSE, что обозначено (] границ

РЕДАКТИРОВАТЬ Спасибо @Rui -

dat1$V3_cut <- cut(as.numeric(dat1$V3), c(0,3,5,11), labels=1:3)
...