Я использую пакет R RedditExtractoR и запускаю следующий код -
#### Reddit Data####
####LOAD LIBRARIES####
#for extracting data
library(RedditExtractoR)
####PARENTING####
parenting_all = get_reddit(search_terms = NA, regex_filter = "", subreddit = "parenting",cn_threshold = 0, page_threshold = 10000, sort_by = "new", wait_time = 2)
save(parenting_all,file="parenting_all.Rda")
Но по какой-то причине, независимо от того, насколько высоко я нажимаю номер page_threshold (например, x10 до 100000), Я получаю только довольно последовательное, ограниченное количество постов / комментариев (примерно 20 000), что означает, что я не могу вернуться очень далеко, в этом случае, примерно к началу сентября ...
Другими словами, нетнезависимо от того, насколько высоко я нажимаю значение page_threshold, я не могу больше выводить посты, и мне хотелось бы снимать посты с прошлого года ... Я знаю, что API Reddit ограничивает количествокомментарии, которые могут быть очищены до 500 за пост, но я, конечно, видел гораздо большие наборы постов в других местах.Есть идеи? Спасибо!