Невозможно извлечь более 88 твитов, несмотря на майнинг для трендовых ключевых слов - PullRequest
0 голосов
/ 08 февраля 2019

Я пытаюсь найти около 20 000 твитов по ключевым словам, которые в настоящее время находятся в тренде на моей временной шкале.

Однако я получаю только около 88 твитов.Это ключевые слова по всей стране, и маловероятно, что доступно всего 88 твитов.

Вот мой код

library(rtweet)
sona_tweets <- search_tweets(
    q = "SONA19 OR SONA2019 OR SONA", 
    n = 25000, 
    type = "popular",
    include_rts = FALSE,
    retryonratelimit = TRUE
)

1 Ответ

0 голосов
/ 09 февраля 2019

При использовании rtweet::search_tweets() вы должны принять к сведению несколько ограничений и аргумент type.

Во-первых, search_tweets() возвращает данные только за последние 6-9 дней.Кроме того, чтобы вернуть более 18 000 статусов за один вызов, необходимо установить retryonlimit = TRUE.

Из документации аргумент type определяется как:

Строка символов, указывающая, какой тип результатов поиска следует возвращать из REST API Twitter.Текущее значение по умолчанию - type = "Recent", другие допустимые типы включают type = "mixed" и type = "Popular".

Поэтому, чтобы получить "все" за последние 6-9 дней, вызахочу использовать type = "mixed".Это означает, что вы должны изменить свой код на это:

library(rtweet)
sona_tweets <- search_tweets(
    q = "SONA19 OR SONA2019 OR SONA", 
    n = 25000, 
    type = "mixed",
    include_rts = FALSE,
    retryonratelimit = TRUE
)

, и вы должны вернуть ожидаемые результаты.

...