У меня есть вопрос относительно соответствия слов из библиотеки (мои исходные данные имеют 2000 строк) в одном столбце в другом столбце (13 строк).Я имею дело со значениями NA и заполняю неравные строки.Однако есть совпадающие слова, поэтому они должны совпадать, тогда как слова, которые не совпадают, должны быть значениями NA.
У меня есть пример данных.
df <- data.frame(words<-c("How","did","Quebec","nationalists","see","their","province","as","a","nation","in","the","1960s"))
df2 <- data.frame(library<-c("How","see","as","a","for","then","than","example"),
embedding1<-c(.5,.6,.7,.8,.9,.3,.46,.48,.53,.42),
embedding2<-c(.1,.5,.4,.8,.9,.3,.98,.73,.48,.56))
Здесь я пытаюсь сопоставить и объединить данные с помощью merge () данных
df<-merge(df, df2, all=T, na.rm=T)
Я не сопоставил слова в столбце с какими-либо предложениями о том, как это сделать?
Я хочу, чтобы мои данные выглядели так ...
df4<-data.frame(words<-c("How","did","Quebec","nationalists","see","their","province","as","a","nation","in","the","1960s"),
matched<-c("How",NA,NA,NA,"see",NA,NA,"as","a",NA,NA,"the",NA),
embedding1<-c(.7,NA,NA,NA,.8,NA,NA,.9,.3,NA,NA,.6,NA),
embedding2<-c(.1,NA,NA,NA,.8,NA,NA,.9,.3,NA,NA,.5,NA))