Подмножества в R studio (основные вопросы)? - PullRequest
0 голосов
/ 10 сентября 2018

Я ужасен с R, и я пытаюсь выяснить подмножества. Я ввел файл данных в R studio через:

> Vehicle_Data <-read.table("VehicleData.txt.txt", header=T,sep="\t",quote="")
> attach(Vehicle_Data)

Я запутался в подмножествах. Один из столбцов в моих данных Type, который включает в себя различные типы транспортных средств. Мне нужно сузить Car в столбце типа, чтобы я мог рассчитать среднее значение MPG только для автомобилей. Вот что я попробовал:

> TypeCar<-subset(Vehicle_Data, Type=="Car")

Я думаю, что это сработало для подмножества данных, но я не уверен. Также я не знаю, как рассчитать mean MPG из подмножества?

Ответы [ 2 ]

0 голосов
/ 10 сентября 2018

Вы можете использовать tidyverse для выполнения преобразований данных, таких как поднабор (фильтрация)

Vehicle_Data %>% 
  filter(Type=="Car")

Вы также можете рассчитать среднее значение MPG для каждого типа следующим образом:

Vehicle_Data %>% 
  group_by(Type) %>% 
  summarise(mean.MPG=mean(MPG, na.rm = TRUE))

Если вы хотите вычислить среднее значение существующего подмножества данных (т. Е. TypeCar), вы можете просто запустить mean(TypeCar$MPG, na.rm = TRUE)

0 голосов
/ 10 сентября 2018

Код для поднабора выглядит нормально.Чтобы вычислить среднее значение, вам нужно использовать функцию mean() следующим образом:

mean_mpg <- mean(TypeCar$MPG, na.rm = TRUE)

Этот код также позаботится о любых значениях NA, присутствующих в ваших данных

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...