Question

Я пытаюсь импортировать кросс-таблицу в R для работы. Таблица выглядит следующим образом:

df <- data.frame(`0` = c(.1, .2, .3),  
`15` = c(70, 70, 71), 
`30` = c(71, 72, 75))

Или:

0    15   30
.1   70   71
.2   70   72
.3   71   75

Я хочу написать фрагмент кода, чтобы перевести его в следующий формат:

df_transformed <- data.frame(x = c(15, 15, 15, 30, 30, 30), y = c(.1, .2, .3, .1, .2, .3), z = c(70, 70, 71, 71, 72, 75)

Или:

Таким образом, df_transformed будет описывать каждую возможную комбинацию с прикрепленным значением, как если бы вы искали ее в перекрестной таблице (df). Т.е. если столбец df равен 15, а строка равна .1, то соответствующее значение равно 70. Есть простой способ сделать это? Я попытался tidyr::gather(), но он не описывает каждое уникальное значение z.

Nik · Answer 1 · 26 марта 2020

Использование gather():

library(tidyverse)

df %>%
  gather(key = "15", value = "30", -`0`) %>%
  select(x = `15`, y = `0`, z = `30`) %>%
  arrange(x, y)

gather(), вероятно, не работало из-за сложной спецификации аргумента. Это одна из причин, по которой было изобретено * 1006.

Я знаю, что выше есть ответ pivot_longer(), который использует все специальные аргументы функции, но это, вероятно, более понятная и не менее эффективная реализация в вашем случае. :

df_transformed <-
  df %>%
  pivot_longer(cols = -`0`, names_to = "15", values_to = "30") %>%
  select(x = `15`, y = `0`, z = `30`) %>%
  arrange(x, y)

Ben · Answer 2 · 26 марта 2020

С tidyverse вы можете сделать:

library(tidyverse)

df %>%
  pivot_longer(cols = c(X15, X30), names_to = c("x"), values_to = "z", names_pattern = "X(\\d+)", names_ptypes = list(x = numeric())) %>%
  rename(y = X0) %>%
  arrange(x, y) %>%
  select(x, y, z)

Выход

# A tibble: 6 x 3
      x     y     z
  <dbl> <dbl> <dbl>
1    15   0.1    70
2    15   0.2    70
3    15   0.3    71
4    30   0.1    71
5    30   0.2    72
6    30   0.3    75

ThomasIsCoding · Answer 3 · 26 марта 2020

Вот базовое решение R с использованием stack

dfout <- setNames(cbind(df[1],stack(df[-1])),u <-c("y","z","x"))[order(u)]

, такое что

> dfout
    x   y  z
1 X15 0.1 70
2 X15 0.2 70
3 X15 0.3 71
4 X30 0.1 71
5 X30 0.2 72
6 X30 0.3 75

jay.sf · Answer 4 · 26 марта 2020

Вы можете использовать outer, чтобы применить Vectorized FUN ction ко всем перестановкам строк и столбцов,

FUN <- Vectorize(function(x, y) df[x, y + 1])
res <- data.frame(x=colnames(m), y=rownames(m), 
                  z=as.vector(outer(1:nrow(m), 1:ncol(m), FUN)),
                  stringsAsFactors=FALSE)
res
#     x   y  z
# 1 X15 0.1 70
# 2 X30 0.2 70
# 3 X15 0.3 71
# 4 X30 0.1 71
# 5 X15 0.2 72
# 6 X30 0.3 75

, где:

sapply(res, class)
#           x           y           z 
# "character" "character"   "numeric"

Если вы хотите x и y должны быть чистой цифрой c, выполните:

res <- transform(res, 
          x=as.numeric(gsub("\\D", "", x)),
          y=as.numeric(y)
          )
#    x   y  z
# 1 15 0.1 70
# 2 30 0.2 70
# 3 15 0.3 71
# 4 30 0.1 71
# 5 15 0.2 72
# 6 30 0.3 75

В более общем смысле , чтобы разбить матрицу m

      C1    C2    C3   C4
R1  9086  9220 11985  469
R2  5627  6463  5447  258
R3  6561  1632  1773   72
R4 12468 12555 13409 1148
R5 21886 28320 22227 2502
R6 23231 22127 23402 3242

на ее координаты строк и столбцов мы можем сделать:

fun <- Vectorize(function(x, y) m[x, y])
res <- cbind(rownames(m), colnames(m), as.vector(outer(1:6, 1:4, fun)))

res
#       [,1] [,2] [,3]   
#  [1,] "R1" "C1" "9086" 
#  [2,] "R2" "C2" "5627" 
#  [3,] "R3" "C3" "6561" 
#  [4,] "R4" "C4" "12468"
#  [5,] "R5" "C1" "21886"
#  [6,] "R6" "C2" "23231"
#  [7,] "R1" "C3" "9220" 
#  [8,] "R2" "C4" "6463" 
#  [9,] "R3" "C1" "1632" 
# [10,] "R4" "C2" "12555"
# [11,] "R5" "C3" "28320"
# [12,] "R6" "C4" "22127"
# [13,] "R1" "C1" "11985"
# [14,] "R2" "C2" "5447" 
# [15,] "R3" "C3" "1773" 
# [16,] "R4" "C4" "13409"
# [17,] "R5" "C1" "22227"
# [18,] "R6" "C2" "23402"
# [19,] "R1" "C3" "469"  
# [20,] "R2" "C4" "258"  
# [21,] "R3" "C1" "72"   
# [22,] "R4" "C2" "1148" 
# [23,] "R5" "C3" "2502" 
# [24,] "R6" "C4" "3242"

Данные

m <- structure(c(9086, 5627, 6561, 12468, 21886, 23231, 9220, 6463, 
1632, 12555, 28320, 22127, 11985, 5447, 1773, 13409, 22227, 23402, 
469, 258, 72, 1148, 2502, 3242), .Dim = c(6L, 4L), .Dimnames = list(
    c("R1", "R2", "R3", "R4", "R5", "R6"), c("C1", "C2", "C3", 
    "C4")))

Импорт кросс-таблицы в R

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 4 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Импорт кросс-таблицы в R

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 4 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы