Question

С учетом фрейма данных в форме

       Key.1 Key.2      Value
1  5/25/2018   -10 0.53928999
2  5/25/2018   -10 0.23083204
3  5/25/2018   -10 0.33742676
4  5/25/2018     0 0.53479860
5  5/25/2018     0 0.27612761
6  5/25/2018     0 0.74993199
7  5/25/2018    10 0.01397069
8  5/25/2018    10 0.10553610
9  5/25/2018    10 0.66147883
10 1/17/2018   -10 0.14381738
11 1/17/2018   -10 0.52708544
12 1/17/2018   -10 0.75862925
13 1/17/2018     0 0.45954116
14 1/17/2018     0 0.68467543
15 1/17/2018     0 0.15865298
16 1/17/2018    10 0.01039363
17 1/17/2018    10 0.49886623
18 1/17/2018    10 0.98269967
19 5/25/2018    10 0.10553610
20 5/25/2018   -10 0.33742676

мне нужно сгенерировать столбец Group из взаимодействия key.1 и key.2, который бы выглядел примерно как

       Key.1 Key.2      Value Group
1  5/25/2018   -10 0.53928999     1
2  5/25/2018   -10 0.23083204     1
3  5/25/2018   -10 0.33742676     1
4  5/25/2018     0 0.53479860     2
5  5/25/2018     0 0.27612761     2
6  5/25/2018     0 0.74993199     2
7  5/25/2018    10 0.01397069     3
8  5/25/2018    10 0.10553610     3
9  5/25/2018    10 0.66147883     3
10 1/17/2018   -10 0.14381738     4
11 1/17/2018   -10 0.52708544     4
12 1/17/2018   -10 0.75862925     4
13 1/17/2018     0 0.45954116     5
14 1/17/2018     0 0.68467543     5
15 1/17/2018     0 0.15865298     5
16 1/17/2018    10 0.01039363     6
17 1/17/2018    10 0.49886623     6
18 1/17/2018    10 0.98269967     6
19 5/25/2018    10 0.10553610     3
20 5/25/2018   -10 0.33742676     1

обратите внимание на последние две строки

, где важно, чтобы значение Group восходило вниз по фрейму данных.Мне удалось получить желаемое поведение с помощью

Data$Group          <-  interaction(paste(Data$Key.1,Data$Key.2),1)
levels(Data$Group)  <-  1:length(levels(Data$Group))
levels(Data$Group)  <-  unique(Data$Group)

, однако это кажется крайне не интуитивным и неуклюжим.

Как сделать так, чтобы это было и короче, и интуитивно понятнее?

Отмечается, что нет реальных ограничений на то, что Key.1 или Key.2 можетbe - основное поведение просто должно быть таким, что Group определяется уникальной парой Key.1 и Key.2 и поднимается вниз по таблице.

MKR · Answer 1 · 26 мая 2018

Можно использовать символ .GRP из data.table для назначения уникального номера группам.Сначала группируйте по Key.1 и Key.2, а затем добавьте новый столбец со значением .GRP.

library(data.table)
setDT(df)
df[,Group:=.GRP, by=.(Key.1, Key.2)]  # Use of .GRP

#Check Result
df
#        Key.1 Key.2      Value Group
# 1: 5/25/2018   -10 0.53928999     1
# 2: 5/25/2018   -10 0.23083204     1
# 3: 5/25/2018   -10 0.33742676     1
# 4: 5/25/2018     0 0.53479860     2
# 5: 5/25/2018     0 0.27612761     2
# 6: 5/25/2018     0 0.74993199     2
# 7: 5/25/2018    10 0.01397069     3
# 8: 5/25/2018    10 0.10553610     3
# 9: 5/25/2018    10 0.66147883     3
# 10: 1/17/2018   -10 0.14381738     4
# 11: 1/17/2018   -10 0.52708544     4
# 12: 1/17/2018   -10 0.75862925     4
# 13: 1/17/2018     0 0.45954116     5
# 14: 1/17/2018     0 0.68467543     5
# 15: 1/17/2018     0 0.15865298     5
# 16: 1/17/2018    10 0.01039363     6
# 17: 1/17/2018    10 0.49886623     6
# 18: 1/17/2018    10 0.98269967     6
# 19: 5/25/2018    10 0.10553610     3
# 20: 5/25/2018   -10 0.33742676     1

Данные:

df <- read.table(text =
"       Key.1 Key.2      Value
1  5/25/2018   -10 0.53928999
2  5/25/2018   -10 0.23083204
3  5/25/2018   -10 0.33742676
4  5/25/2018     0 0.53479860
5  5/25/2018     0 0.27612761
6  5/25/2018     0 0.74993199
7  5/25/2018    10 0.01397069
8  5/25/2018    10 0.10553610
9  5/25/2018    10 0.66147883
10 1/17/2018   -10 0.14381738
11 1/17/2018   -10 0.52708544
12 1/17/2018   -10 0.75862925
13 1/17/2018     0 0.45954116
14 1/17/2018     0 0.68467543
15 1/17/2018     0 0.15865298
16 1/17/2018    10 0.01039363
17 1/17/2018    10 0.49886623
18 1/17/2018    10 0.98269967
19 5/25/2018    10 0.10553610
20 5/25/2018   -10 0.33742676",
stringsAsFactors = FALSE, header = TRUE)

avid_useR · Answer 2 · 25 мая 2018

Вот идея с использованием факторов:

С Базой R:

df$Group = as.integer(factor(paste(df$Key.1, df$Key.2), 
                             levels = unique(paste(df$Key.1, df$Key.2))))

Или с mutate из dplyr:

library(dplyr)

df = mutate(df, Group = paste(Key.1, Key.2) %>% 
         factor(., levels = unique(.)) %>%
         as.integer())

Результат:

       Key.1 Key.2      Value Group
1  5/25/2018   -10 0.53928999     1
2  5/25/2018   -10 0.23083204     1
3  5/25/2018   -10 0.33742676     1
4  5/25/2018     0 0.53479860     2
5  5/25/2018     0 0.27612761     2
6  5/25/2018     0 0.74993199     2
7  5/25/2018    10 0.01397069     3
8  5/25/2018    10 0.10553610     3
9  5/25/2018    10 0.66147883     3
10 1/17/2018   -10 0.14381738     4
11 1/17/2018   -10 0.52708544     4
12 1/17/2018   -10 0.75862925     4
13 1/17/2018     0 0.45954116     5
14 1/17/2018     0 0.68467543     5
15 1/17/2018     0 0.15865298     5
16 1/17/2018    10 0.01039363     6
17 1/17/2018    10 0.49886623     6
18 1/17/2018    10 0.98269967     6
19 5/25/2018    10 0.10553610     3
20 5/25/2018   -10 0.33742676     1

Данные:

df = structure(list(Key.1 = c("5/25/2018", "5/25/2018", "5/25/2018", 
"5/25/2018", "5/25/2018", "5/25/2018", "5/25/2018", "5/25/2018", 
"5/25/2018", "1/17/2018", "1/17/2018", "1/17/2018", "1/17/2018", 
"1/17/2018", "1/17/2018", "1/17/2018", "1/17/2018", "1/17/2018", 
"5/25/2018", "5/25/2018"), Key.2 = c(-10L, -10L, -10L, 0L, 0L, 
0L, 10L, 10L, 10L, -10L, -10L, -10L, 0L, 0L, 0L, 10L, 10L, 10L, 
10L, -10L), Value = c(0.53928999, 0.23083204, 0.33742676, 0.5347986, 
0.27612761, 0.74993199, 0.01397069, 0.1055361, 0.66147883, 0.14381738, 
0.52708544, 0.75862925, 0.45954116, 0.68467543, 0.15865298, 0.01039363, 
0.49886623, 0.98269967, 0.1055361, 0.33742676)), .Names = c("Key.1", 
"Key.2", "Value"), class = "data.frame", row.names = c("1", "2", 
"3", "4", "5", "6", "7", "8", "9", "10", "11", "12", "13", "14", 
"15", "16", "17", "18", "19", "20"))

Генерация ключевого столбца из столбцов без фактора

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 2 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Генерация ключевого столбца из столбцов без фактора

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 2 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Нет похожих вопросов