У меня есть два файла.
The first one looks like below,
> data.frame(head(Becker))
Becker
1 ABACK BACK A+ (BACK)
2 ABACUS ABACUS ~- (ABACUS)
3 ABANDGN ABANDON A+ ( BANDON)
4 ABANDONED ABANDON A+ (BANDON) +ED
5 ABANDONING ABANDON A+( BANDON) +ING
6 ABANOONMENT ABANDON A+( BANDON) #MENT
The second file looks like
> data.frame(head(unique))
Word
1 Aback
2 carful
3 basketful
4 meaningful
5 boxful
6 armsful
My ideal output
1 ABACK BACK A+ (BACK)
То есть я хотел только извлечь слова (включая слова соседей), которые присутствуют в обоих файлах.
Я прочитал похожие вопросы и узнал о функции semi_join. Тем не менее, я продолжал получать сообщение об ошибке. Вот мой код и сообщение об ошибке. Не могли бы вы помочь мне, как правильно применить эту функцию? или я должен использовать разные функции? Если да, то какую функцию я должен использовать? Спасибо.
semi_join(Becker, unique, by=c("Becker"="Word"))
Becker <= output
1 as
Warning message:
Column `Becker`/`Word` joining factors with different levels, coercing to character
vector