Мне нужно создать таблицу, содержащую переменные в одном-единственном конкретном формате, потому что она будет использоваться в качестве входных данных для другой программы. С этой целью я пытаюсь изменить свои данные (конечно, используя R), которые выглядят так:
# A tibble: 185,754 x 4
rowid `SMPDB ID` `HMDB ID` `TRUE`
<int> <chr> <chr> <lgl>
1 1 SMP00004 HMDB0006454 TRUE
2 2 SMP00004 HMDB0001451 TRUE
3 3 SMP00004 HMDB0000005 TRUE
4 4 SMP00005 HMDB0000142 TRUE
5 5 SMP00006 HMDB0000060 TRUE
6 6 SMP00008 HMDB0000060 TRUE
7 7 SMP00009 HMDB0001451 TRUE
8 8 SMP00011 HMDB0004249 TRUE
9 9 SMP00011 HMDB0003850 TRUE
10 10 SMP00011 HMDB0006953 TRUE
# ... with 185,744 more rows
Есть разные SMPDB ID
для каждого HMDB ID
,
и мне понадобится что-то вроде:
SMPDB ID HMDB IDs
HMDB0006454 SMP00004, SMP00027, SMP00060, ...
HMDB0001451 SMP00004, SMP00008, SMP00090, ...
...
только с двумя столбцами, первый со SMPDB ID
, а другой со всеми HMDB ID
.
Как вы думаете, можно ли изменить это так?
Возможно, начиная с spread
?
Здесь стартовый стол, если вы хотите попробовать!
Заранее спасибо!