повторяющиеся строки, возникающие при использовании inner_join в r - PullRequest
0 голосов
/ 14 января 2019

Я пытаюсь использовать inner_join между двумя фреймами данных, но получаю повторяющиеся значения после объединения.

Я попытался создать 2 подмножества из исходного кадра данных, используя только 2 записи, а затем соединить их. Но все равно получаю повторяющиеся значения для каждого user_ids.

ab1<- subset(df.age.dlx,df.age.dlx$user_id=="9218960788394762284" | df.age.dlx$user_id == "9221471567096564493")
View(ab1)


ab2 <-subset(df.gender.dlx,df.gender.dlx$user_id=="9218960788394762284" | df.gender.dlx$user_id == "9221471567096564493")
View(ab2)

ab.join<-inner_join(xyz_df,xyz1_df,by="user_id")
View(ab.join)

enter image description here

1 Ответ

0 голосов
/ 14 января 2019

Без примера представления данных здесь могут быть некоторые трудности, но это должно работать:

library(tidyverse)

ab1 <- df.age.dlx %>%
  filter(user_id == "9218960788394762284" | user_id == "9221471567096564493")

ab2 <- df.gender.dlx %>%
  filter(user_id == "9218960788394762284" | user_id == "9221471567096564493")

ab_join <- merge(ab1, ab2, by = "user_id")

В зависимости от того, что вы собираетесь делать со своим полным набором данных, вы можете увидеть, как вы соединяете все вышеперечисленное.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...