Некоторые сайты имеют шаблон URL от www.___.com/id=1 до www.___.com/id=1000. Как я могу сканировать сайт с помощью NUTCH. Есть ли способ обеспечить семена для получения в диапазоне ??
www.___.com/id=1
www.___.com/id=1000
Я думаю, что проще всего было бы создать скрипт для генерации вашего первоначального списка URL.
нет. вы вводите их вручную или используете скрипт