Моя проблема: я хочу сохранить столбец наблюдения от фрейма данных y, когда присоединюсь к ним. Чтобы сослаться на исходный фрейм данных. Прямо сейчас, когда я выполняю left_join (), я получаю нулевые значения для наблюдений. Столбец данных Fame y называется «Obs»
Я уже пробовал использовать различные типы объединения или реорганизации фреймов данных x и y
Простой пример того, что я пытаюсь сделать:
x = data.frame(fun =c("cool", "neat" , "awesome", "neat1", "amazing", "sweet"), address = c("100", "1100", "99", "900", "55", "200"), state = c("IL", "CO", "MO", "CA", "MA", "TX"), date = c(12,3,4, 6, 8, 9))
y = data.frame(fun =c("cool", "neat" , "awesome", "super"), address = c("100", "1100", "99","55"), state = c("IL", "CO", "MO", "MA"), status = c(T,F,T, T))
y$Obs = 1:nrow(y)
x %>% left_join(y, by =c("address", "state"))
По какой-то причине вышеприведенный пример кода работает с показом наблюдений, однако, когда я запускаю его на своих реальных наборах данных с фреймом данных x, имеющим около 18000 записей, и фреймом данных y, имеющим 2100 записей. Я получаю все значения NA для наблюдений. Даже если они совпадают на основе state
и address
.
Предполагается, что у меня есть новый объединенный фрейм данных со столбцом наблюдения, на который ссылаются (то же самое) на фрейм данных y. Когда я запускаю его, я получаю все значения NA для Obs