Question

Кто-нибудь знает, как удалить весь столбец из data.frame в R? Например, если мне дают эти data.frame:

> head(data)
   chr       genome region
1 chr1 hg19_refGene    CDS
2 chr1 hg19_refGene   exon
3 chr1 hg19_refGene    CDS
4 chr1 hg19_refGene   exon
5 chr1 hg19_refGene    CDS
6 chr1 hg19_refGene   exon

и я хочу удалить 2-й столбец.

Joshua Ulrich · Answer 1 · 09 июня 2011

Вы можете установить его на NULL.

> Data$genome <- NULL
> head(Data)
   chr region
1 chr1    CDS
2 chr1   exon
3 chr1    CDS
4 chr1   exon
5 chr1    CDS
6 chr1   exon

Как указано в комментариях, здесь есть и другие возможности:

Data[2] <- NULL    # Wojciech Sobala
Data[[2]] <- NULL  # same as above
Data <- Data[,-2]  # Ian Fellows
Data <- Data[-2]   # same as above

Вы можете удалить несколько столбцов с помощью:

Data[1:2] <- list(NULL)  # Marek
Data[1:2] <- NULL        # does not work!

Будьте осторожны с подмножеством матриц, поскольку вы можете получить вектор:

Data <- Data[,-(2:3)]             # vector
Data <- Data[,-(2:3),drop=FALSE]  # still a data.frame

Prasad Chalasani · Answer 2 · 09 июня 2011

Чтобы удалить один или несколько столбцов по имени, когда известны имена столбцов (в отличие от определения во время выполнения), мне нравится синтаксис subset(). Например. для фрейма данных

df <- data.frame(a=1:3, d=2:4, c=3:5, b=4:6)

чтобы удалить только тот столбец a, который вы могли бы сделать

Data <- subset( Data, select = -a )

и удалить столбцы b и d, которые вы можете сделать

Data <- subset( Data, select = -c(d, b ) )

Вы можете удалить все столбцы между d и b с помощью:

Data <- subset( Data, select = -c( d : b )

Как я уже говорил выше, этот синтаксис работает только тогда, когда известны имена столбцов. Это не будет работать, если, скажем, имена столбцов определены программно (то есть назначены переменной). Я воспроизведу это предупреждение из ?subset документации:

Внимание:

Это удобная функция, предназначенная для интерактивного использования. Для программирования лучше использовать стандартное подмножество такие функции, как '[', и, в частности, нестандартная оценка аргумента «подмножество» может иметь непредвиденные последствия.

ceiling cat · Answer 3 · 03 июня 2015

(для полноты) Если вы хотите удалить столбцы по имени, вы можете сделать это:

cols.dont.want <- "genome"
cols.dont.want <- c("genome", "region") # if you want to remove multiple columns

data <- data[, ! names(data) %in% cols.dont.want, drop = F]

Включая drop = F гарантирует, что результат все равно будет data.frame, даже если только один столбецостается.

Chase · Answer 4 · 19 июля 2012

Опубликованные ответы очень хороши при работе с data.frame с.Однако эти задачи могут быть довольно неэффективными с точки зрения памяти.Для больших данных удаление столбца может занять необычно много времени и / или завершиться неудачей из-за ошибок out of memory.Пакет data.table помогает решить эту проблему с помощью оператора :=:

library(data.table)
> dt <- data.table(a = 1, b = 1, c = 1)
> dt[,a:=NULL]
     b c
[1,] 1 1

Я должен собрать более крупный пример, чтобы показать различия.Я обновлю этот ответ в какой-то момент с этим.

Nirali Khoda · Answer 5 · 04 августа 2017

С этим вы можете удалить column и сохранить variable в другом variable.

df = subset(data, select = -c(genome) )

sbha · Answer 6 · 20 марта 2019

Существует несколько вариантов удаления одного или нескольких столбцов с помощью dplyr::select() и некоторых вспомогательных функций. Вспомогательные функции могут быть полезны, потому что некоторые не требуют именования всех определенных столбцов, которые будут отброшены. Обратите внимание, что для удаления столбцов с помощью select() необходимо использовать начальный - для отмены имен столбцов.

Использование образца данных dplyr::starwars для некоторого разнообразия в именах столбцов:

library(dplyr)

starwars %>% 
  select(-height) %>%                  # a specific column name
  select(-one_of('mass', 'films')) %>% # any columns named in one_of()
  select(-(name:hair_color)) %>%       # the range of columns from 'name' to 'hair_color'
  select(-contains('color')) %>%       # any column name that contains 'color'
  select(-starts_with('bi')) %>%       # any column name that starts with 'bi'
  select(-ends_with('er')) %>%         # any column name that ends with 'er'
  select(-matches('^v.+s$')) %>%       # any column name matching the regex pattern
  select_if(~!is.list(.)) %>%          # not by column name but by data type
  head(2)

# A tibble: 2 x 2
homeworld species
  <chr>     <chr>  
1 Tatooine  Human  
2 Tatooine  Droid

Вы также можете перейти по номеру столбца:

starwars %>% 
  select(-2, -(4:10)) # column 2 and columns 4 through 10

Удалить весь столбец из data.frame в R

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 6 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Удалить весь столбец из data.frame в R

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 6 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Нет похожих вопросов