Я пытаюсь ускорить выполнение следующей задачи:
# For retrieving Cancer Genome Atlas RNAseq data
library(RTCGA.rnaseq)
# Extract information from sample ID about what kind of samples are in the dataset. 01 means tumor, 06 means metastatic tumor, 10 means healthy etc.
SKCM_sampletype <- as.factor(substr(x = SKCM.rnaseq$bcr_patient_barcode, 14, 15))
summary(SKCM_sampletype)
01 06
1 367
# Other objects I like to apply this function are (I have 30some objects but showing few below:
# (ACC.rnaseq,BLCA.rnaseq,BRCA.rnaseq,CESC.rnaseq,CHOL.rnaseq,COAD.rnaseq)
Что я хочу сделать, так это иметь фрагмент кода, который просматривает список объектов и выполняет substring
иsummary
функций.Я также хотел бы объединить все статистические данные summary
и график в виде графика, который выглядит следующим образом:
![sample image](https://i.stack.imgur.com/G7sJg.png)
Мои основные проблемы должны сделатьс двумя основными пунктами: 1- Как написать функцию loop
(или apply
?), которая будет использовать объекты. 2- Каков наилучший метод организации данных, который легко использовать с пакетом ggplot2
.
Спасибо за вашу помощь!