Я пытаюсь сканировать начальные URL-адреса, которые являются http / https, но для нескольких URL-адресов https я получаю сообщение об ошибке FetcherThread INFO api.HttpRobotRulesParser (168) - Не удалось получить robots.txt для https://corporate.douglas.de/investors/?lang=en: javax.net.ssl.SSLHandshakeException: sun.security.validator.ValidatorException: сбой построения пути PKIX: sun.security.provider.certpath.SunCertPathBuilderException: невозможно найти действительный путь сертификации к запрошенной цели
с другой стороны https://www.integrafin.co.uk/annual-reports/отлично сканируется
ниже находится мой плагин конфигурации. Включает протокол-http | urlfilter-regex | parse- (html | tika | text) | index- (базовый | якорь | еще | статические | ссылки) | indexer-solr | скоринг-OPIC | urlnormalizer- (передвигайте | регулярное выражение | основной) | urlmeta | язык-идентификатор