Поиск полей пароля покажет вам, но не поможет с сайтами, которые используют HTTP-аутентификацию.Поиск 401s поможет с HTTP-аутентификацией, но не даст вам сайты, которые не используют ее, или те, которые не возвращают 401. Поиск ссылок, таких как поля «войти» или «имя пользователя», даст вам больше информации..
Я не думаю, что вы сможете сделать это полностью автоматически и быть уверенным, что вы действительно обнаруживаете все защищенные паролем области.
Возможно, вы захотитевзять библиотеку, которая хороша в веб-автоматизации, и самостоятельно написать небольшую программу, которая читает список целевых сайтов из файла, проверяет каждый и записывает в один файл слова «они определенно пародированы» и «это не так», а затем вы можете захотеть вручную проверить те, которые не являются, и внести изменения в вашу программу, чтобы приспособиться.Использование httrack отлично подходит для сбора данных, но это не поможет в обнаружении - если вы напишите свою собственную программу «проверка области, защищенной паролем», с помощью HLL общего назначения, вы сможете выполнять больше проверок и избежать генерации большего количества запросов.на сайт, чем необходимо для определения наличия защищенной паролем области.
Возможно, вам придется игнорировать robots.txt
Я рекомендую использовать порт perls mechanize для механизации или любую другую красивую библиотеку веб-автоматизации, которую вы предпочитаете.Почти все современные языки будут иметь хорошую библиотеку для открытия и поиска по веб-страницам, а также для просмотра заголовков HTTP.
Если вы не способны написать это самостоятельно, вам будет довольно сложно использоватьhttrack или wget или аналогичные, а затем поиск по ответам.