В моем классе по науке о данных у меня есть заданный вопрос: «Используйте функции base R для создания переменной, называемой region, во фрейме данных birth_data, который принимает значения« Северо-восток, Средний Запад, Юг и Запад ».
В настоящее время мой код
Northeast <- birth_data$state %in% c("CT", "ME", "MA", "NH", "RI", "VT", "NJ", "NY","PA")
Midwest <- birth_data$state %in% c("IL", "IN", "MI", "OH", "WI",
"IA", "KS", "MN", "MO", "NE", "ND", "SD")
South <- birth_data$state %in% c("DE", "DC", "FL", "GA", "MA", "NC", "SC", "VA", "WV", "AL", "KY", "MS", "TN", "AS", "LA", "OK", "TX")
West <- birth_data$state %in% c("AZ", "CO", "ID", "MO", "NV", "NM", "UT", "WY","AK", "CA", "HI", "OR", "WA")
birth_data$region <- c("Northeast","Midwest","South","West")
birth_data <- birth_data$region
Ошибка в $<-.data.frame
(*tmp*
, регион, значение = c ("Северо-восток", "Средний Запад"): замена имеет 4 строки, данные имеют 1103629
Я не уверен, как исправить эту проблему, но я знаю, что это связано с длиной вектора. Кроме того, я не уверен, как назначать переменные для символов. Если разрешен dplyr, я чувствую,Я был бы более успешным.