Мне действительно трудно создать синтаксис регулярных выражений, который я мог бы использовать с нашим сканером, чтобы получить все URL-адреса, заканчивающиеся словом «скачать».Не могли бы вы помочь?Большое спасибо!
Вот URL для соответствия
https://www.example.com/folder1/download
https://www.example.com/folder1/download/
https://www.example.com/folder1/folder2/download?cmp=abc
Примечания: i.Перед конечным словом может быть более одной папки. Ii.К конечному слову может быть прикреплена строка запроса или косая черта iii.URL-адреса в основном относительные URL-адреса.Но было бы действительно лучше, если бы регулярное выражение совпадало с абсолютными URL-адресами, URL-адресами без указанных протоколов, с или без части www.
Ex.
<a href="/product-category/product-name/download">Download Tool</a>
Or
<a href="https://www.example.com/product-category/product-name/download">Download Tool</a>
Or
<a href="http://www.example.com/product-category/product-name/download">Download Tool</a>
Or
<a href="www.example.com/product-category/product-name/download">Download Tool</a>
Or
<a href="example.com/product-category/product-name/download">Download Tool</a>
Хотя большинство из вышеперечисленного заканчивалось бы перенаправлением 301 илине может рассматриваться как действительный URL-адрес, но было бы замечательно найти такие аномалии как часть этого сканирования.
Фон сканера: это вкладка настройки регулярного выражения - https://www.screencast.com/t/LJsKobubg3 Это один изПользовательское сканирование Мне удалось запустить в прошлом с помощью регулярных выражений с помощью команды разработчиков (который сейчас недоступен) - https://www.screencast.com/t/9mT2pSoP7sI Так будет выглядеть конечный результат - https://www.screencast.com/t/MC5MNaJXi
КонецРезультатом является электронная таблица, которая показывает все страницы соратников + совпадения URL.
Мне было дано регулярное выражение, но это не соответствует относительным URL-адресам, а также извлекает все окружающие HTML-тексты в отчете о конечном результате, а не только URL-адрес.https://regex101.com/r/5nHp8s/1
Еще раз большое спасибо за помощь.