Вот подход, который использует lapply()
с фреймом данных Motor Trend Cars.
data(mtcars)
mtcars$type <- rownames(mtcars)
mtcars$make <-unlist(lapply(strsplit(mtcars$type," "),function(x){x[[1]]}))
head(mtcars)
и результат:
> head(mtcars)
mpg cyl disp hp drat wt qsec vs am gear carb
Mazda RX4 21.0 6 160 110 3.90 2.620 16.46 0 1 4 4
Mazda RX4 Wag 21.0 6 160 110 3.90 2.875 17.02 0 1 4 4
Datsun 710 22.8 4 108 93 3.85 2.320 18.61 1 1 4 1
Hornet 4 Drive 21.4 6 258 110 3.08 3.215 19.44 1 0 3 1
Hornet Sportabout 18.7 8 360 175 3.15 3.440 17.02 0 0 3 2
Valiant 18.1 6 225 105 2.76 3.460 20.22 1 0 3 1
type make
Mazda RX4 Mazda RX4 Mazda
Mazda RX4 Wag Mazda RX4 Wag Mazda
Datsun 710 Datsun 710 Datsun
Hornet 4 Drive Hornet 4 Drive Hornet
Hornet Sportabout Hornet Sportabout Hornet
Valiant Valiant Valiant
>
Обратите внимание, что необходима некоторая дополнительная очистка данных, поскольку Valiant и Duster были изготовлены Plymouth, Camaro Z28 - Chevrolet, а Hornet 4 Drive - американской компанией Motor Cars, также известной как AMC.
Относительно вопроса в комментариях о синтаксисе, используемом в lapply()
, я использовал lapply()
для обработки результатов strsplit()
, включая анонимную функцию , которая извлекает первое слово из каждого элемента из списка.
Поскольку выходные данные функции R могут использоваться в качестве аргумента другой функции, это решение объединяет функции для получения желаемого результата.
Ответ sapply()
, предоставленный akrun, делает то же самое, используя вывод strsplit()
в качестве входных данных и используя [
, одну из четырех форм оператора извлечения для извлечения данных. sapply()
также создает вектор, а не список в качестве вывода.