RedditExtractoR в R не тянет посты после определенной точки? - PullRequest
0 голосов
/ 01 октября 2018

Я использую пакет R RedditExtractoR и запускаю следующий код -

#### Reddit Data####

####LOAD LIBRARIES####
#for extracting data
library(RedditExtractoR)

####PARENTING####
parenting_all = get_reddit(search_terms = NA, regex_filter = "", subreddit = "parenting",cn_threshold = 0, page_threshold = 10000, sort_by = "new", wait_time = 2)
save(parenting_all,file="parenting_all.Rda")

Но по какой-то причине, независимо от того, насколько высоко я нажимаю номер page_threshold (например, x10 до 100000), Я получаю только довольно последовательное, ограниченное количество постов / комментариев (примерно 20 000), что означает, что я не могу вернуться очень далеко, в этом случае, примерно к началу сентября ...

Другими словами, нетнезависимо от того, насколько высоко я нажимаю значение page_threshold, я не могу больше выводить посты, и мне хотелось бы снимать посты с прошлого года ... Я знаю, что API Reddit ограничивает количествокомментарии, которые могут быть очищены до 500 за пост, но я, конечно, видел гораздо большие наборы постов в других местах.Есть идеи? Спасибо!
...