Могу ли я создать подмножество агрегированного объекта CellDataSet, используя Monocle в R? - PullRequest
2 голосов
/ 13 февраля 2020

У меня есть объект CelldataSet (cds):

> class(cds)
[1] "CellDataSet"
attr(,"package")
[1] "monocle"

, состоящий из 6 различных агрегированных выборок, которые можно различить по суффиксам их штрих-кодов. Вот пример того, как они выглядят:

cds$barcode
1   ACCAACGACTTGCC-1
2   CGCACTACTCGATG-4
3   CGTACAGAGTATCG-5
4   CGTCAAGATCACCC-5
5   ACTGAGACCCGTAA-2
6   TTAGACCTCGGGAA-6
7   TTCAAGCTGGTATC-3
8   TTTGACTGTCCTTA-4
9   TTTGCATGCTCTTA-4
10  AAACATTGAAGCCT-5

Возможно ли разделить этот объект CellDataSet на 6 меньших объектов CellDataSet, каждый из которых содержит штрих-коды с одинаковым суффиксом "-n", поэтому я могу проанализировать каждый образец отдельно? Например, штрих-коды CellDataSet1 будут выглядеть следующим образом:

cds$barcode
1   AAACCGTGCCCTCA-1
2   AAACGCACACGCAT-1
3   AAACGGCTTCCGAA-1
4   AAAGACGAACCCAA-1
5   AAAGACGACTGTTT-1
6   AAAGAGACAAAGCA-1
7   AAAGATCTGGTAAA-1
8   AAAGCAGAGCAAGG-1
9   AAAGCAGATTATCC-1
10  AAAGCCTGATGACC-1

et c и будут содержать соответствующие атрибуты, как в исходном объекте.

Большое спасибо!

Абигайль

1 Ответ

1 голос
/ 13 февраля 2020

Вы можете использовать tidyverse для решения проблемы:

library(tidyverse)
dataseti <- data.frame(barcode = c("ACCAACGACTTGCC-1",
                                  "GCACTACTCGATG-4",
                                  "CGTACAGAGTATCG-5",
                                  "CGTCAAGATCACCC-5",
                                  "ACTGAGACCCGTAA-2",
                                  "TTAGACCTCGGGAA-6", 
                                  "TTCAAGCTGGTATC-3",
                                  "TTTGACTGTCCTTA-4",
                                  "TTTGCATGCTCTTA-4",
                                  "AAACATTGAAGCCT-5"),
                      stringsAsFactors = FALSE)

Допустим, вы хотите группу 4

dataseti %>% separate(barcode, c("chain","group"),"-") %>% filter(group == 4)

Удачи!

...