Транспонирование 96-луночного планшета PCR в формат с одной колонкой - PullRequest
0 голосов
/ 29 марта 2019

ПЦР-планшеты работают в системе координат, аналогичной системе координат XY.Я хотел бы преобразовать 96-луночный планшет для ПЦР из этой системы координат XY (формат строки и столбца) в формат только с одним столбцом, объединяя вместе систему xy (т. Е. Строка B и столбец 12 = B12).

Первый набор данных, представленный ниже и называемый «pcr_plate», представляет собой формат 96-луночного планшета для ПЦР.

Второй набор данных, называемый «sample_transposed_plate», является примером желаемого результата.

Я пробовал классические подходы к транспонированию данных, используя код из следующих пакетов:

library (dplyr) library (tidyr)

В дополнение к transform (data.frame, ...)

Однако я не совсем понимаю, как написать код, начинающийся со строки A12 строки 1:12, затем столбца B строки 1:12 и т. д. при сохранении соответствующего образца (так же хорошо) в соседнем столбце

два образца рабочих наборов данных:

pcr_plate <- read.table ("https://pastebin.com/raw/bGhzj5dU", header = T, sep = "")


sample_transposed_plate <- read.table ("https://pastebin.com/raw/xyzv9cvH", header=T, sep = "") # example of desired outcome

Логически, учитывая, что имеется 96 лунок, у меня должно быть 96 строк данных в конце (97 сзаголовок).Первый столбец будет "местоположение", а второй столбец будет "образец"

Ответы [ 2 ]

1 голос
/ 29 марта 2019

Это то, что вы ищете (ниже)

  • Первая строка преобразует данные из широкого в длинный
  • Вторая строка удаляет "X" из значений и вставляет его с табличкой (буквой),
  • Третья строка выбирает ваши столбцы (и переименовывает один)
  • Четвертая строка - это способ упорядочить данные сначала по букве, а затем по номеру в well_ID.

Дайте мне знать, если это не сработает или у вас есть какие-либо вопросы.

pcr_plate <- read.table ("https://pastebin.com/raw/bGhzj5dU", header = T, sep = "")

library(dplyr)
library(tidyr)

gather(pcr_plate, key = "key", value = "sample", -pcr.plate) %>%
  mutate(pcr.plate = paste0(pcr.plate, gsub("X", "", key))) %>%
  select(well_ID = pcr.plate, sample) %>%
  arrange(gsub("\\d", "", well_ID, as.numeric(gsub("\\D", "", well_ID))))

   well_ID     sample
1       A1     1-TypA
2       A2     1-TypA
3       A3     2-TypA
4       A4     2-TypA
5       A5     3-TypA
6       A6     3-TypA
7       A7     4-TypA
8       A8     4-TypA
9       A9   H20-TypA
10     A10   H20-TypA
11     A11  PosA-TypA
12     A12  PosB-RP49
13      B1     1-TypB
14      B2     1-TypB
15      B3     2-TypB
16      B4     2-TypB
17      B5     3-TypB
18      B6     3-TypC
19      B7     4-TypB
20      B8     4-TypB
21      B9   H20-TypB
22     B10   H20-TypB
23     B11  PosA-TypA
24     B12  PosB-RP49
25      C1     1-TypC
26      C2     1-TypC
27      C3     2-TypC
28      C4     2-TypC
29      C5     3-TypC
30      C6     3-TypB
31      C7     4-TypC
32      C8     4-TypC
33      C9   H20-TypC
34     C10   H20-TypC
35     C11  PosA-RP49
36     C12   PosB-H20
37      D1     1-RPS5
38      D2     1-RPS5
39      D3     2-RPS5
40      D4     2-RPS5
41      D5     3-RPS5
42      D6     3-RPS5
43      D7     4-RPS5
44      D8     4-RPS5
45      D9   H20-RPS5
46     D10   H20-RPS5
47     D11  PosA-RP49
48     D12   PosB-H20
49      E1     1-RP49
50      E2     1-RP49
51      E3     2-RP49
52      E4     2-RP49
53      E5     3-RP49
54      E6     3-RP49
55      E7     4-RP49
56      E8     4-RP49
57      E9   H20-RP49
58     E10   H20-RP49
59     E11   PosA-H20
60     E12        H20
61      F1   1-F1430A
62      F2   1-F1430A
63      F3   2-F1430A
64      F4   2-F1430A
65      F5   3-F1430A
66      F6   3-F1430A
67      F7   4-F1430A
68      F8   4-F1430A
69      F9 H20-F1430A
70     F10 H20-F1430A
71     F11   PosA-H20
72     F12        H20
73      G1   1-F1409B
74      G2   1-F1409B
75      G3   2-F1409B
76      G4   2-F1409B
77      G5   3-F1409B
78      G6   3-F1409B
79      G7   4-F1409B
80      G8   4-F1409B
81      G9 H20-F1409B
82     G10 H20-F1409B
83     G11  PosB-TypA
84     G12        H20
85      H1      1-H20
86      H2      1-H20
87      H3      2-H20
88      H4      2-H20
89      H5      3-H20
90      H6      3-H20
91      H7      4-H20
92      H8      4-H20
93      H9    H20-H20
94     H10    H20-H20
95     H11  PosB-TypA
96     H12        H20

EDIT:

Ложная тревога в моем комментарии, она сработала как задумано. Это еще один способ сделать это, хотя и получить тот же результат. Дайте мне знать, если у вас есть вопросы!

gather(pcr_plate, key = "key", value = "sample", -pcr.plate) %>%
  mutate(key = as.numeric(gsub("X", "", key))) %>%
  arrange(pcr.plate, key) %>%
  mutate(pcr.plate = paste0(pcr.plate, key)) %>%
  select(well_ID = pcr.plate, sample)
1 голос
/ 29 марта 2019

Вы можете просто использовать типичный gather для преобразования из широких в длинные данные:

library(tidyverse)
pcr_plate <- read.table ("https://pastebin.com/raw/bGhzj5dU", header = T, sep = "")
sample_transposed_plate <- read.table ("https://pastebin.com/raw/xyzv9cvH", header=T, sep = "")

pcr_plate_long = pcr_plate %>%
  gather(number, content, -pcr.plate) %>%
  mutate(number = str_remove(number, "^X"),
         well_ID = paste0(pcr.plate, number)) %>%
  select(content, well_ID)
...