Ускорение повторяющейся задачи создания объекта и применения функции - PullRequest
0 голосов
/ 02 июня 2018

Я пытаюсь ускорить выполнение следующей задачи:

# For retrieving Cancer Genome Atlas RNAseq data

library(RTCGA.rnaseq)



# Extract information from sample ID about what kind of samples are in the dataset. 01 means tumor, 06 means metastatic tumor, 10 means healthy etc.

SKCM_sampletype <- as.factor(substr(x = SKCM.rnaseq$bcr_patient_barcode, 14, 15))
summary(SKCM_sampletype)

  01  06 
   1 367 

# Other objects I like to apply this function are (I have 30some objects but showing few below:
# (ACC.rnaseq,BLCA.rnaseq,BRCA.rnaseq,CESC.rnaseq,CHOL.rnaseq,COAD.rnaseq)

Что я хочу сделать, так это иметь фрагмент кода, который просматривает список объектов и выполняет substring иsummary функций.Я также хотел бы объединить все статистические данные summary и график в виде графика, который выглядит следующим образом:

sample image

Мои основные проблемы должны сделатьс двумя основными пунктами: 1- Как написать функцию loop (или apply?), которая будет использовать объекты. 2- Каков наилучший метод организации данных, который легко использовать с пакетом ggplot2.

Спасибо за вашу помощь!

1 Ответ

0 голосов
/ 02 июня 2018

Вы можете попробовать использовать lapply для интересующих вас столбцов, например:

summarise_column <- function(x) {
  cat(x)
  summary(factor(substr(SKCM.rnaseq[[x]], 14, 15)))
}

lapply(c("the", "variables", "I", "would", "like", "to", "summarise"), summarise_column)
...