Мне нужно сравнить два текстовых файла и сопоставить некоторые слова одних данных с другими в R
# file 1 (text file) =the actual file has 30000 rows..
992 DESPOT DESPOT (DESPOT)
993 DESPOTIC DESPOT (DESPOT)+IC
994 DESPOTISM DESPOT (DESPOT)+ISM
995 DESSERT DESSERT DES#(SERT)
996 DESTINATION DESTINE DE#(STE)+INE*ATE+IUN
# file 2$Word : the actual file has 12000 rows
869 despot
870 darker
871 dasher
872 fearer
873 oiler
874 dieter
Идеальные результаты. DESPOT DESPOT (DESPOT)
- Я хотел бы использовать файл 2 в качестве справочного файла, и если файл 1 содержит те же слова (что и файл 2), я хочу указать точное слово, включая слова соседства (в этом примере DESPOT (DESPOT) из файла 1.
Я просмотрел похожие вопросы и предложил ответ
file1$matched <- sapply(file2$Word, function(x) paste(grep(x, file1, value = TRUE), collapse = ","))
Я использовал код выше, но я получил сообщение об ошибке.
Error in `$<-.data.frame`(`*tmp*`, matched, value = c("", "", "", "", replacement
Может ли кто-нибудь мне помочь? В противном случае, я должен кодировать вручную ..