как я могу реализовать Excel как VLOOKUP, если искомый индекс представляет собой комбинацию вектора столбца и заголовков строк? - PullRequest
0 голосов
/ 14 января 2019

В настоящее время я пытаюсь реорганизовать набор данных, который отображает информацию о домохозяйстве по нескольким параметрам. Мне нужно реорганизовать данные, так как некоторые данные (координаты) дублируются в векторе столбца.

Я не могу установить пустой фрейм данных, который затем могу заполнить правильной функцией для извлечения данных из моего начального набора данных. Я хотел бы иметь координаты либо в виде имен строк, либо в качестве первого вектора в наборе данных df_new (я не уверен, что будет лучше для этого сценария). Возрастные группы будут именами столбцов. Но теперь у меня нет самого индекса в df_new (который я использовал бы с функцией слияния для получения данных из df). Мне нужно было бы создать индекс путем объединения имени строки (или первого вектора в наборе данных) с именем столбца для создания индекса. Поскольку конкатенация создаст уникальный индекс, я надеюсь, что смогу перетащить ссылочный номер из исходного набора данных в новый (представленный как NA в примере кода).

column_vector <- c("50", "50", " 50")
row_vector_1 <- c("Age_10","Age_15","Age_20")
row_vector_2 <- c("6","3","2")
df <- data.frame(column_vector, row_vector_1, row_vector_2)
df
colnames(df)<- c("Coordinates", "Age_indicator", "reference_NR")
df$index <- paste(df$Coordinates, df$Age_indicator, sep = "_")
df_new <- data.frame(c(50, 51, 52), c("NA", "NA", "NA"), c("NA", "NA", "NA"))
colnames(df_new) <- c( "Coordinates", "Age_10", "Age_15")
df_new

в конце это df_new должно выглядеть так:

enter image description here

6 и 4, где вытащил от первоначального df. 2-й и 3-й ряд - NA, потому что их координаты не указаны в df. Я хотел бы, чтобы они также были заполнены их соответствующими reference_NR

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...