Как импортировать огромное количество файлов и преобразовать данные в R? - PullRequest
0 голосов
/ 05 октября 2019

У меня есть разные данные в разных .csv файлах, как показано ниже:

Sample1.csv:

read_count     Region       barcode
12      mature,MIMAT0000062 Sample1
10      mature,MIMAT0000062 Sample1
22      mature,MIMAT0000062 Sample1
539     mature,MIMAT0000062 Sample1
20218   mature,MIMAT0000062 Sample1
2              precursor    Sample1
1              precursor    Sample1
58      mature,MIMAT0000063 Sample1
173     mature,MIMAT0000063 Sample1
5723    mature,MIMAT0000063 Sample1
1            unannotated    Sample1
11           unannotated    Sample1
97           unannotated    Sample1
2               stemloop    Sample1

Sample2.csv:

read_count  miRNA_region    barcode
1            precursor      Sample2
5     mature,MIMAT0004484   Sample2
3     mature,MIMAT0004484   Sample2
12    mature,MIMAT0004484   Sample2
1     mature,MIMAT0004484   Sample2
118   mature,MIMAT0004484   Sample2
6434  mature,MIMAT0004484   Sample2
1            stemloop       Sample2
1            precursor      Sample2
2     mature,MIMAT0000065   Sample2
2     mature,MIMAT0000065   Sample2
55    mature,MIMAT0000065   Sample2
126   mature,MIMAT0000065   Sample2
85    mature,MIMAT0000065   Sample2

Iесть данные в около 1000 .csv файлов. Данные выглядят как выше в файлах. Я хочу суммировать read_count зрелых тех же регионов. И я хочу исключить все предшественники, петли стебля, аннотированные. Я хочу сохранить только регионы со зрелыми.

Я хочу, чтобы вывод выглядел так, как показано ниже:

  Region       Sample1  Sample2
MIMAT0000062    20801      0
MIMAT0000063    5954       0
MIMAT0004484     0       6573
MIMAT0000065     0        270

Итак, как я уже сказал выше, у меня есть 1000 .csv файлов. Как импортировать все файлы в R и получить вывод, как указано выше?

...