Я новичок в Crawling and Nutch.
У меня есть несколько внутренних сайтов с проверкой подлинности Azure AD MFA, содержащей информацию, которую мне нужно сканировать и индексировать для поиска.
У меня была настройкаВиртуальная машина Ubuntu Server 18.04 в Azure с Nutch 1.5 и Solr 6.6, которая работает нормально для обычного сканирования веб-сайтов.
Проблема заключается в том, что я пытаюсь сканировать сайты с проверкой подлинности MFA.
Любое руководствоКак я могу преодолеть проблему:
1> Есть ли что-то, что я могу настроить в Nutch, чтобы он работал «из коробки»?
2> Нужно ли что-то настраивать вAzure?
3> Любые другие советы или другие рекомендации ...
Спасибо.