как правильно использовать функцию semi_join - PullRequest
0 голосов
/ 18 марта 2020

У меня есть два файла.

 The first one looks like below,
    > data.frame(head(Becker))
                                     Becker
      1                  ABACK BACK A+ (BACK)
      2             ABACUS ABACUS ~- (ABACUS)
      3          ABANDGN ABANDON A+ ( BANDON)
      4     ABANDONED ABANDON A+ (BANDON) +ED
      5   ABANDONING ABANDON A+( BANDON) +ING
      6 ABANOONMENT ABANDON A+( BANDON) #MENT

  The second file looks like
        > data.frame(head(unique))
                         Word
                 1      Aback
                 2     carful
                 3  basketful
                 4 meaningful
                 5     boxful
                 6    armsful

  My ideal output 
  1      ABACK BACK A+ (BACK)

То есть я хотел только извлечь слова (включая слова соседей), которые присутствуют в обоих файлах.

Я прочитал похожие вопросы и узнал о функции semi_join. Тем не менее, я продолжал получать сообщение об ошибке. Вот мой код и сообщение об ошибке. Не могли бы вы помочь мне, как правильно применить эту функцию? или я должен использовать разные функции? Если да, то какую функцию я должен использовать? Спасибо.

 semi_join(Becker, unique, by=c("Becker"="Word"))

         Becker                    <= output
         1     as

       Warning message:
 Column `Becker`/`Word` joining factors with different levels, coercing to character 
  vector
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...