Наконец-то удалось решить эту проблему после того, как долго ломал голову. Так что делимся этим здесь :)
Вы должны настроить параметры, определенные в nutch-default.xml
в каталоге conf
Так что проверьте значение max.content.length
, определенное для этого, будет около 60 КБ, но на самом деле содержимое страницы было намного больше, поэтому он не мог сканировать всю страницу, и поэтому ссылки не могли отображаться на просканированной странице.
Так что перед сканированием любого сайта проверьте эти параметры :)
Приятного ползания:)
PS: Я сожалею, что в некоторых случаях я чувствую, что я задаю вопрос здесь, а затем публикую решение Перед отправкой вопроса я действительно много пробовал ..