В настоящее время я пытаюсь реорганизовать набор данных, который отображает информацию о домохозяйстве по нескольким параметрам. Мне нужно реорганизовать данные, так как некоторые данные (координаты) дублируются в векторе столбца.
Я не могу установить пустой фрейм данных, который затем могу заполнить правильной функцией для извлечения данных из моего начального набора данных. Я хотел бы иметь координаты либо в виде имен строк, либо в качестве первого вектора в наборе данных df_new (я не уверен, что будет лучше для этого сценария). Возрастные группы будут именами столбцов. Но теперь у меня нет самого индекса в df_new (который я использовал бы с функцией слияния для получения данных из df). Мне нужно было бы создать индекс путем объединения имени строки (или первого вектора в наборе данных) с именем столбца для создания индекса. Поскольку конкатенация создаст уникальный индекс, я надеюсь, что смогу перетащить ссылочный номер из исходного набора данных в новый (представленный как NA в примере кода).
column_vector <- c("50", "50", " 50")
row_vector_1 <- c("Age_10","Age_15","Age_20")
row_vector_2 <- c("6","3","2")
df <- data.frame(column_vector, row_vector_1, row_vector_2)
df
colnames(df)<- c("Coordinates", "Age_indicator", "reference_NR")
df$index <- paste(df$Coordinates, df$Age_indicator, sep = "_")
df_new <- data.frame(c(50, 51, 52), c("NA", "NA", "NA"), c("NA", "NA", "NA"))
colnames(df_new) <- c( "Coordinates", "Age_10", "Age_15")
df_new
в конце это df_new должно выглядеть так:
6 и 4, где вытащил от первоначального df. 2-й и 3-й ряд - NA, потому что их координаты не указаны в df. Я хотел бы, чтобы они также были заполнены их соответствующими reference_NR