Загрузите первые n строк / символов, используя RCurl - PullRequest
2 голосов
/ 23 января 2012

Мне нужно использовать пакет RCurl для загрузки содержимого различных URL-адресов (с использованием аутентификации и т. Д.).Чтобы оптимизировать скорость загрузки, я бы хотел ограничить количество выводимых строк / символов выходных ответов, поскольку мне нужны только первые 20 строк каждой страницы, а весь размер содержимого может быть очень большим.

При использовании readLines это можно сделать быстроНапример:

readLines("http://www.nytimes.com/", n = 20L)

Однако, используя RCurl и указав максимальный символьный параметр, я не получаю ожидаемого результата:

test <- getURL("http://www.nytimes.com/", write = basicTextGatherer(max = 1000))
> nchar(test)
[1] 125709

Согласно RCurl Страница часто задаваемых вопросов настраиваемая функция обратного вызова должна сделать свое дело, однако, я точно не знаю, как.

...