Все дело в определениях, «действительный URL» должен предоставлять вам IP-адрес, когда вы выполняете поиск DNS. IP-адрес должен быть подключен, и при отправке запроса вы получите ответ в виде HTML-информации, которую вы можете использовать.
Итак, мы ищем «действительный формат URL», и именно здесь system.uri
очень пригодится. НО, если URL-адрес скрыт в большом фрагменте текста, вы сначала хотели бы найти что-то, что подтверждает правильность URL-формата.
То, что отличает URL от любого читаемого текста, это точка, за которой не следует пробел. «123.com» может проверяться как реальный URL.
Использование регулярного выражения
[a-z_\.\-0-9]+\.[a-z]+[^ ]*
, чтобы найти любой возможный допустимый URL-адрес в тексте, а затем выполнить проверку system.uri, чтобы убедиться, что это правильный формат URL, а затем выполнить поиск. Только когда поиск даст вам результат, вы узнаете, что URL действителен.