Я уже давно возился с этим и не смог разобраться, как работает файл default-regex-filters.txt для StormCrawler.
В одном примере мне нужно ограничить сканер ТОЛЬКО элементами для сканирования под https://www.example.com/dev и без каких-либо других каталогов на этом сайте. Я поставил правило
+.*\/dev\/.*
в последнюю строку файла default-regex-filters.txt, но, похоже, он не работает. Я думал, что применяются стандартные правила регулярных выражений, но, похоже, это не так. один из приведенных выше примеров имел / без \ до него и он работал? Я довольно смущен этим, и мне интересно, есть ли в этом файле шпаргалка для регулярных выражений, чтобы мне было легче их построить.
Верно ли, что в файле может быть только один + фильтр? Я смутно помню, что читал это, но хотел быть уверенным.