Вы должны получить a callback
за каждую просканированную страницу . Входящий параметр res
описывает каждую страницу.
Попробуйте что-то подобное для своей функции обратного вызова.
callback : function (error, res, done) {
if(error) {
console.log(error);
} else {
const $ = res.$;
const title = $("title").text()); //find the page's title
const url = res.request.uri.toString(); //get the fetched URL
const display = `Title of ${url}: {title}`; //make your display string
console.log(display); //display it
}
done();
}
$
позволяет вам использовать jQuery -подобные операции для поиска основного текста ("traverse" объектная модель документа ") страницы, найденной сканером. Необработанный основной текст отображается на res.body
, если вы хотите его увидеть. Но имейте в виду, что он выглядит точно так же, как View Source ... для просканированной страницы.
Совет: Могу ли я предложить вам отладить это с помощью maxConnections: 2
вместо 10
? Сканирование может создать большую нагрузку на сайт, а сканирование с новым мощным приложением может ухудшить ситуацию.