Измените 2d матрицу (data.frame), объединив имена строк и столбцов - PullRequest
1 голос
/ 19 января 2020

Вопрос

Во время написания диссертации я получил забавное задание. У меня есть 2D-matrix (или data.frame), как это:

     CACE        cheng     cheng2        ding    ding_ass        sun2
mean    0 -0.000467158 0.01219119 0.004284223 0.003803375 0.004204354
sd      0  0.131911914 0.14457078 0.074447198 0.055980336 0.072260046
            sun3
mean 0.004202419
sd   0.072266683

Выше матрицы описывает производительность нескольких моделей (их mean и sd). Я хочу перечислить их в своей статье, поэтому мне нужно изменить их следующим образом:

     CACE_mean CACE_sd   cheng_mean  cheng_sd cheng2_mean cheng2_sd
[1,]         0       0 -0.000467158 0.1319119  0.01219119 0.1445708
       ding_mean   ding_sd ding_ass_mean ding_ass_sd   sun2_mean
[1,] 0.004284223 0.0744472   0.003803375  0.05598034 0.004204354
        sun2_sd   sun3_mean    sun3_sd
[1,] 0.07226005 0.004202419 0.07226668

Это похоже на сглаживание matrix или data.frame, но не традиционное long в wide изменение формы задачи. Мне интересно, можем ли мы сделать это, используя высокоуровневые функции.

Данные

Исходные данные (dput):

structure(c(0, 0, -0.000467157971792085, 0.131911914238178, 0.0121911908647192, 
0.144570781843054, 0.00428422254646622, 0.0744471979273107, 0.00380337457776962, 
0.0559803359990803, 0.00420435426517323, 0.0722600458117494, 
0.00420241918783969, 0.0722666828398023), .Dim = c(2L, 7L), .Dimnames = list(
    c("mean", "sd"), c("CACE", "cheng", "cheng2", "ding", "ding_ass", 
    "sun2", "sun3")))

Моя попытка

new_names = c(outer(row.names(a),colnames(a),function(x,y){paste(y,x,sep = '_')}))
new_data = t(data.frame(c(a),row.names = new_names))
rownames(new_data) <- NULL

Это работает очень хорошо, но я хочу знать некоторые другие идеи.

Ответы [ 4 ]

1 голос
/ 19 января 2020

Мы можем использовать unite после преобразования с as.data.frame.table

library(dplyr)
library(tidyr)
as.data.frame.table(m1) %>%
   unite(Var1, Var2, Var1) %>%
   spread(Var1, Freq)
#    CACE_mean CACE_sd   cheng_mean  cheng_sd cheng2_mean cheng2_sd ding_ass_mean ding_ass_sd   ding_mean   ding_sd   sun2_mean    sun2_sd
#1         0       0 -0.000467158 0.1319119  0.01219119 0.1445708   0.003803375  0.05598034 0.004284223 0.0744472 0.004204354 0.07226005
#    sun3_mean    sun3_sd
#1 0.004202419 0.07226668
1 голос
/ 19 января 2020

Мы можем преобразовать матрицу в фрейм данных, получить имя строки в виде отдельного столбца и преобразовать данные в более широкий формат.

df %>%
  as.data.frame() %>%
  tibble::rownames_to_column() %>%
  tidyr::pivot_wider(names_from = rowname, values_from = -rowname)

#   CACE_mean CACE_sd cheng_mean cheng_sd cheng2_mean cheng2_sd ding_mean ding_sd
#      <dbl>   <dbl>      <dbl>    <dbl>       <dbl>     <dbl>     <dbl>   <dbl>
#1         0       0  -0.000467    0.132      0.0122     0.145   0.00428  0.0744
# … with 6 more variables: ding_ass_mean <dbl>, ding_ass_sd <dbl>, sun2_mean <dbl>,
#   sun2_sd <dbl>, sun3_mean <dbl>, sun3_sd <dbl>
1 голос
/ 19 января 2020

Метод, аналогичный вашему, но более компактный

m <- `colnames<-`(t(c(a)),c(t(outer(colnames(a),paste0("_",rownames(a)),paste0))))

такой, что

> m
     CACE_mean CACE_sd   cheng_mean  cheng_sd cheng2_mean cheng2_sd   ding_mean   ding_sd
[1,]         0       0 -0.000467158 0.1319119  0.01219119 0.1445708 0.004284223 0.0744472
     ding_ass_mean ding_ass_sd   sun2_mean    sun2_sd   sun3_mean    sun3_sd
[1,]   0.003803375  0.05598034 0.004204354 0.07226005 0.004202419 0.07226668
1 голос
/ 19 января 2020

Вы можете c связать ячейки и setNames согласно шаблону.

setNames(do.call(c, as.data.frame(dat)),
         paste(rep(colnames(dat), each=2), rownames(dat), sep=".")
)
#   CACE.mean       CACE.sd    cheng.mean      cheng.sd   cheng2.mean     cheng2.sd     ding.mean 
# 0.000000000   0.000000000  -0.000467158   0.131911914   0.012191191   0.144570782   0.004284223 
#     ding.sd ding_ass.mean   ding_ass.sd     sun2.mean       sun2.sd     sun3.mean       sun3.sd 
# 0.074447198   0.003803375   0.055980336   0.004204354   0.072260046   0.004202419   0.072266683 
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...