Выберите столбцы для тепловой карты в R - PullRequest
1 голос
/ 02 июня 2010

Мне снова нужна ваша помощь:)

Я написал скрипт R, который генерирует тепловую карту из заданного с разделением табуляцией файла txt или xls. В данный момент я удаляю все столбцы, которые не хочу иметь в тепловой карте, вручную в файле xls. Теперь я хочу автоматизировать это, но я не знаю, как: (

Интересные столбцы начинаются одинаково во всех файлах xls, за которыми следует индивидуальное имя:

xls-файл 1: L1_tpm_xxxx L2_tpm_xxxx L3_tpm_xxxx

xls-файл 2: L1_tpm_xxxx L2_tpm_xxxx L3_tpm_xxxx L4_tpm_xxxx L5_tpm_xxxx

Есть идеи, как выбрать эти столбцы?

Благодарю вас в ожидании, Филипп

Ответы [ 2 ]

2 голосов
/ 02 июня 2010

Вы можете использовать (если вы прочитали свои данные в data.frame df):

df <- df[,grep("^L[[:digit:]]+_tpm.*",colnames(df))]

или вы можете явно указать нужные столбцы:

df <- df[,c("L1_tpm_xxxx","L2_tpm_xxxx","L3_tpm_xxxx")]

и т.д ...

Следующая ссылка весьма полезна; -)

0 голосов
/ 02 июня 2010

Если вы думаете, что позиции столбцов будут фиксироваться на листах Excel, самое простое решение здесь - просто использовать индексы столбцов. Например, если вы используете read.table для импорта текстового файла с разделителями табуляции как data.frame, а затем решили, что предпочитаете оставить только первые два столбца, вы можете сделать что-то вроде этого:

data <- read.table("path_to_file.txt", header=T, sep="\t")
data <- data[,1:2]
...