Pivot_longer 6 столбцов до 3 столбцов - PullRequest
2 голосов
/ 31 марта 2020

Я знаю, что мой вопрос прост, но я пробовал все утро и не могу обойти его.

У меня есть этот фрейм данных:

  GeneID Gene.Symbol01    Ratio.2h   Ratio.6h  Ratio.10h  Ratio.24h  Pvalue_2h
 1    174           FUT -0.23618761 -0.3276162 -0.1366940 -4.4899131 0.49045105
  Pvalue_6h Pvalue_10h   Pvalue_24h
 1 0.06128851 0.59995612 0.0001798584

И я нужно pivot_longer для всех столбцов, кроме GeneID и GeneSymbol. Полученный фрейм данных должен иметь 3 новых столбца. Один со временем: 2 часа, 6 часов, 10 часов и 24 часа. Затем еще два столбца со значениями отношения и еще один с pvalues.

Я знаю, что это должно быть сделано с помощью комбинации имен names_to и names_pattern. Я пробовал много вещей, но я не могу получить это.

Последнее, что я попробовал, было это:

pivot_longer(cols = -c(GeneID, Gene.Symbol01),
             names_to = c("Time", ".value"),
             names_pattern = "_")

Производительность:

structure(list(GeneID = 174, Gene.Symbol01 = "FUT", Ratio.2h = -0.23618761, 
    Ratio.6h = -0.3276162, Ratio.10h = -0.136694, Ratio.24h = -4.4899131, 
    Pvalue_2h = 0.49045105, Pvalue_6h = 0.06128851, Pvalue_10h = 0.59995612, 
    Pvalue_24h = 0.0001798584), row.names = c(NA, -1L), class = c("tbl_df", 
"tbl", "data.frame"))

Ответы [ 2 ]

2 голосов
/ 31 марта 2020

Используя tidyverse, вы, возможно, захотите pivot_longer всю переменную от Ratio.2h до Pvalue_24h, затем separate на 2 столбца.

library(tidyverse)

DF %>% 
  pivot_longer(Ratio.2h:Pvalue_24h, names_to = "var") %>%
  separate(var, into = c("type", "time"), sep = "_|\\.")

# # A tibble: 8 x 5
#   GeneID Gene.Symbol01 type   time      value
#    <dbl> <chr>         <chr>  <chr>     <dbl>
# 1    174 FUT           Ratio  2h    -0.236   
# 2    174 FUT           Ratio  6h    -0.328   
# 3    174 FUT           Ratio  10h   -0.137   
# 4    174 FUT           Ratio  24h   -4.49    
# 5    174 FUT           Pvalue 2h     0.490   
# 6    174 FUT           Pvalue 6h     0.0613  
# 7    174 FUT           Pvalue 10h    0.600   
# 8    174 FUT           Pvalue 24h    0.000180

затем измените ее на более широкую форматирование с использованием pivot_wider

DF %>% 
  pivot_longer(Ratio.2h:Pvalue_24h, names_to = "var") %>%
  separate(var, into = c("type", "time"), sep = "_|\\.") %>%
  pivot_wider(names_from = "type", values_from = "value")

# # A tibble: 4 x 5
#   GeneID Gene.Symbol01 time   Ratio   Pvalue
#    <dbl> <chr>         <chr>  <dbl>    <dbl>
# 1    174 FUT           2h    -0.236 0.490   
# 2    174 FUT           6h    -0.328 0.0613  
# 3    174 FUT           10h   -0.137 0.600   
# 4    174 FUT           24h   -4.49  0.000180

Данные

DF <- tribble(~GeneID, ~Gene.Symbol01,  ~Ratio.2h,   ~Ratio.6h, ~Ratio.10h, ~Ratio.24h, ~Pvalue_2h,~Pvalue_6h, ~Pvalue_10h,   ~Pvalue_24h,
              174, "FUT", -0.23618761, -0.3276162, -0.1366940, -4.4899131, 0.49045105,0.06128851, 0.59995612, 0.0001798584)
0 голосов
/ 31 марта 2020

с использованием расплава:

library(data.table)


melt(df,id.vars=1:2) %>% separate(variable,c("type","time"))) %>%
 pivot_wider(names_from =type,values_from= value)

Результат:


#
# GeneID Gene.Symbol01 time   Ratio   Pvalue
#   <dbl> <fct>         <chr>  <dbl>    <dbl>
#1    174 FUT           2h    -0.236 0.490   
#2    174 FUT           6h    -0.328 0.0613  
#3    174 FUT           10h   -0.137 0.600   
#4    174 FUT           24h   -4.49  0.000180

...