Изменение формы данных с помощью R (возможно, это просто, а может и нет) - PullRequest
0 голосов
/ 04 сентября 2018

Мне нужно создать таблицу, содержащую переменные в одном-единственном конкретном формате, потому что она будет использоваться в качестве входных данных для другой программы. С этой целью я пытаюсь изменить свои данные (конечно, используя R), которые выглядят так:

# A tibble: 185,754 x 4
   rowid `SMPDB ID` `HMDB ID`   `TRUE`
   <int> <chr>      <chr>       <lgl> 
 1     1 SMP00004   HMDB0006454 TRUE  
 2     2 SMP00004   HMDB0001451 TRUE  
 3     3 SMP00004   HMDB0000005 TRUE  
 4     4 SMP00005   HMDB0000142 TRUE  
 5     5 SMP00006   HMDB0000060 TRUE  
 6     6 SMP00008   HMDB0000060 TRUE  
 7     7 SMP00009   HMDB0001451 TRUE  
 8     8 SMP00011   HMDB0004249 TRUE  
 9     9 SMP00011   HMDB0003850 TRUE  
10    10 SMP00011   HMDB0006953 TRUE  
# ... with 185,744 more rows

Есть разные SMPDB ID для каждого HMDB ID, и мне понадобится что-то вроде:

SMPDB ID    HMDB IDs
HMDB0006454 SMP00004, SMP00027, SMP00060, ...
HMDB0001451 SMP00004, SMP00008, SMP00090, ...
...

только с двумя столбцами, первый со SMPDB ID, а другой со всеми HMDB ID.

Как вы думаете, можно ли изменить это так?

Возможно, начиная с spread?

Здесь стартовый стол, если вы хотите попробовать!

Заранее спасибо!

...