Как добавить порядковый номер для каждого элемента в кадре данных? - PullRequest
0 голосов
/ 08 октября 2018

Этот вопрос является продолжением Как добавить номер столбца перед каждым элементом?

V1 <- c("a", "a", "b", "b", "b")
V2 <- c("c" ,"d", "e" ,"e", "f")
V3  <- c("i", "j", "k", "l", "m")
df <- data.frame(V1, V2, V3)
df[] <- Map(paste0, seq_along(df), df)

ВЫХОД

  V1 V2 V3
1 1a 2c 3i
2 1a 2d 3j
3 1b 2e 3k
4 1b 2e 3l
5 1b 2f 3m

Как я могувместо этого создать следующий вывод?

  V1       V2       V3
1 1.1.a   2.1.c   3.1.i
2 1.1.a   2.2.d   3.2.j
3 1.2.b   2.3.e   3.3.k
4 1.2.b   2.3.e   3.4.l
5 1.2.b   2.4.f   3.5.m

Ответы [ 3 ]

0 голосов
/ 08 октября 2018

Вы можете использовать инструкцию Map, которой предшествует lapply.

f <- function(x){
  sp <- split(x, x)
  unlist(lapply(seq_along(sp), function(i) paste(i, sp[[i]], sep = ".")))
}

df[] <- lapply(df, f)
df[] <- Map(paste, seq_along(df), df, sep = ".")

df
#     V1    V2    V3
#1 1.1.a 2.1.c 3.1.i
#2 1.1.a 2.2.d 3.2.j
#3 1.2.b 2.3.e 3.3.k
#4 1.2.b 2.3.e 3.4.l
#5 1.2.b 2.4.f 3.5.m
0 голосов
/ 08 октября 2018

Другой вариант - использовать match с unique элементами каждого столбца и делать paste

df[] <- paste(col(df), sapply(df, function(x) match(x, unique(x))), 
                as.matrix(df), sep=".")
df
#     V1    V2    V3
#1 1.1.a 2.1.c 3.1.i
#2 1.1.a 2.2.d 3.2.j
#3 1.2.b 2.3.e 3.3.k
#4 1.2.b 2.3.e 3.4.l
#5 1.2.b 2.4.f 3.5.m

или использовать tidyverse

library(tidyverse)
imap(seq_along(df), ~ 
           df %>% 
              select(.x) %>%
              mutate_at(1, funs(paste(.y, match(., unique(.)), ., sep="." )))) %>%
     bind_cols
#     V1    V2    V3
#1 1.1.a 2.1.c 3.1.i
#2 1.1.a 2.2.d 3.2.j
#3 1.2.b 2.3.e 3.3.k
#4 1.2.b 2.3.e 3.4.l
#5 1.2.b 2.4.f 3.5.m
0 голосов
/ 08 октября 2018
V1 <- c("a", "a", "b", "b", "b")
V2 <- c("c" ,"d", "e" ,"e", "f")
V3  <- c("i", "j", "k", "l", "m")
dtf <- data.frame(V1, V2, V3)

num <- sapply(dtf, function(x) cumsum(-duplicated(x) + 1))

(m <- sapply(1:3, function(x) paste(x, num[, x], dtf[, x], sep=".")))
#      [,1]    [,2]    [,3]   
# [1,] "1.1.a" "2.1.c" "3.1.i"
# [2,] "1.1.a" "2.2.d" "3.2.j"
# [3,] "1.2.b" "2.3.e" "3.3.k"
# [4,] "1.2.b" "2.3.e" "3.4.l"
# [5,] "1.2.b" "2.4.f" "3.5.m"

Это матрица без имен столбцов, но мы можем это исправить.

as.data.frame(m, col.names=colnames(dtf))
#      V1    V2    V3
# 1 1.1.a 2.1.c 3.1.i
# 2 1.1.a 2.2.d 3.2.j
# 3 1.2.b 2.3.e 3.3.k
# 4 1.2.b 2.3.e 3.4.l
# 5 1.2.b 2.4.f 3.5.m
...