Как сканировать сайт ajax с использованием Apache Nutch - PullRequest
0 голосов
/ 08 июня 2018

Я хочу просканировать этот сайт: https://511.org/alerts/traffic/incidents, используя Apache Nutch.Веб-страница имеет динамически загружаемый контент AJAX.Если я сканирую его с настройками по умолчанию, Nutch просто приносит верхние и нижние колонтитулы, и динамически загружаемый контент теряется.Я использую Nutch 1.14.

1 Ответ

0 голосов
/ 08 июня 2018

С Nutch 1.14 вы можете использовать плагины Nutch Selenium или Nutch Interactive Selenium для сканирования страниц с динамически загружаемыми элементами.

...