Преобразовать столбец data.frame в вектор? - PullRequest
130 голосов
/ 16 августа 2011

У меня есть датафрейм, такой как:

a1 = c(1, 2, 3, 4, 5)
a2 = c(6, 7, 8, 9, 10)
a3 = c(11, 12, 13, 14, 15)
aframe = data.frame(a1, a2, a3)

Я попробовал следующее, чтобы преобразовать один из столбцов в вектор, но это не работает:

avector <- as.vector(aframe['a2'])
class(avector) 
[1] "data.frame"

Это единственное решение, которое я мог бы предложить, но я предполагаю, что должен быть лучший способ сделать это:

class(aframe['a2']) 
[1] "data.frame"
avector = c()
for(atmp in aframe['a2']) { avector <- atmp }
class(avector)
[1] "numeric"

Примечание: Мой словарь выше может быть отключен, поэтому, пожалуйста, исправьте меня, если так. Я все еще изучаю мир R. Кроме того, приветствуется любое объяснение того, что здесь происходит (т. Е. Отношение к Python или другому языку поможет!)

Ответы [ 9 ]

178 голосов
/ 16 августа 2011

Я попытаюсь объяснить это, не допустив ошибок, но держу пари, что это привлечет одно или два уточнения в комментариях.

Фрейм данных - это список. Когда вы устанавливаете подкадр данных, используя имя столбца и [, вы получаете подсписок (или подкадр данных). Если вам нужен фактический атомарный столбец, вы можете использовать [[, или, если хотите, вы можете ввести aframe[,2], который возвращает вектор, а не подсписок.

Так что попробуйте выполнить эту последовательность, и, возможно, все будет яснее:

avector <- as.vector(aframe['a2'])
class(avector) 

avector <- aframe[['a2']]
class(avector)

avector <- aframe[,2]
class(avector)
29 голосов
/ 16 августа 2011

Вы можете использовать $ извлечение:

class(aframe$a1)
[1] "numeric"

или двойную квадратную скобку:

class(aframe[["a1"]])
[1] "numeric"
19 голосов
/ 16 августа 2011

Вам не нужно as.vector(), но вам нужна правильная индексация: avector <- aframe[ , "a2"]

Еще одна вещь, о которой нужно знать, это опция drop=FALSE для [:

R> aframe <- data.frame(a1=c1:5, a2=6:10, a3=11:15)
R> aframe
  a1 a2 a3
1  1  6 11
2  2  7 12
3  3  8 13
4  4  9 14
5  5 10 15
R> avector <- aframe[, "a2"]
R> avector
[1]  6  7  8  9 10
R> avector <- aframe[, "a2", drop=FALSE]
R> avector
  a2
1  6
2  7
3  8
4  9
5 10
R> 
18 голосов
/ 08 января 2018

Теперь есть простой способ сделать это, используя dplyr.

dplyr::pull(aframe, a2)
8 голосов
/ 14 сентября 2016

Еще одним преимуществом использования оператора [[[] является то, что он работает как с data.frame, так и с data.table. Таким образом, если функция должна быть запущена как для data.frame, так и для data.table, и вы хотите извлечь из нее столбец как вектор, тогда

data[["column_name"]] 

лучше.

5 голосов
/ 05 октября 2018

Вы можете попробовать что-то вроде этого -

as.vector(unlist(aframe$a2))
4 голосов
/ 16 августа 2011

Если вы просто используете оператор извлечения, он будет работать.По умолчанию [] устанавливает опцию drop=TRUE, что вам и нужно.Подробнее см. ?'['.

>  a1 = c(1, 2, 3, 4, 5)
>  a2 = c(6, 7, 8, 9, 10)
>  a3 = c(11, 12, 13, 14, 15)
>  aframe = data.frame(a1, a2, a3)
> aframe[,'a2']
[1]  6  7  8  9 10
> class(aframe[,'a2'])
[1] "numeric"
2 голосов
/ 02 июля 2017
a1 = c(1, 2, 3, 4, 5)
a2 = c(6, 7, 8, 9, 10)
a3 = c(11, 12, 13, 14, 15)
aframe = data.frame(a1, a2, a3)
avector <- as.vector(aframe['a2'])

avector<-unlist(avector)
#this will return a vector of type "integer"
1 голос
/ 03 декабря 2018

Я использую списки для фильтрации информационных фреймов по тому, имеют ли они значение% в% списка.

Я создавал списки вручную, экспортируя кадр данных с 1 столбцом в Excel, где я добавил бы "" вокруг каждого элемента, перед вставкой в ​​R: list <- c ("el1", "el2", ...) за которым обычно следует FilteredData <- subset (Данные, Столбец% в% списке). </p>

После поиска в stackoverflow и не найдя интуитивно понятного способа преобразования 1-столбцового фрейма данных в список, я публикую свой первый в истории вклад в stackoverflow:

# assuming you have a 1 column dataframe called "df"
list <- c()
for(i in 1:nrow(df)){
  list <- append(list, df[i,1])
}
View(list)
# This list is not a dataframe, it is a list of values
# You can filter a dataframe using "subset([Data], [Column] %in% list")
...