rtweet - поиск по нескольким ключевым словам AND / OR - PullRequest
1 голос
/ 07 апреля 2020

Я использую пакет rtweet для получения твитов, которые содержат определенные c ключевые слова. Я знаю, как выполнить сопоставление "и" / "или", но как объединить их в один запрос по ключевому слову с несколькими условиями ИЛИ / и. Например, поисковый запрос, который я могу добавить sh в функцию search_twitter:

('ca sh' или 'currency', или 'banknote', или 'accept ca sh 'или' безналичный ') И (' скрытый 'или' вирус 'или' коронавирус ')

Таким образом, твиты могут содержать любое из слов в первой скобке, а также любое из слов во второй скобка.

1 Ответ

0 голосов
/ 08 апреля 2020

Использование dplyr:

Предполагается, что у вас есть df со столбцом, который содержит символьное поле твитов:

Пример данных:

df <- structure(list(Column = c("coronavirus cash", "covid", "currency covid", 
"currency coronavirus", "coronavirus virus", "trees", "plants", 
"moneys")), row.names = c(NA, -8L), class = c("tbl_df", "tbl", 
"data.frame"))

Вы можете используйте следующее:

library(dplyr)

match <- df %>%
  dplyr::filter(str_detect(Column, "cash|currency|banknote|accepting cash|cashless")) %>%
  dplyr::filter(str_detect(Column, "covid|virus|coronavirus"))
...