Регулярный период выражения - PullRequest
2 голосов
/ 26 января 2010

(? (HTTPS | FTP): // | WWW.) (\ S + [^ *.])

Я бы хотел проверить это выражение. по очереди друг к другу. Если он находит два или более периодов подряд, выражение должно завершиться ошибкой. С другой стороны, если это удастся, я хочу, чтобы он соответствовал каждому символу и / или символу вплоть до первого обнаруженного пробела.

Другими словами: www.yahoo..com должен потерпеть неудачу

Относительно примечания: я понимаю, что это выражение является очень базовым с точки зрения оценки правильной структуры URL. У меня есть другое «более интеллектуальное» регулярное выражение, которое предшествует приведенному выше. Цель размещенного сообщения - проверить правильность URL-адреса, который передается из исходного регулярного выражения через preg_match_all.

Ответы [ 3 ]

3 голосов
/ 26 января 2010

Вы можете попробовать FILTER_VALIDATE_URL с http://php.net/manual/en/book.filter.php вместо использования Regex для проверки ваших URL.

Вот пример использования:

$ url = "http://www.example.com";

if(!filter_var($url, FILTER_VALIDATE_URL))
  {
  echo "URL is not valid";
  }
else
  {
  echo "URL is valid";
  }
0 голосов
/ 26 января 2010

Вы можете сделать что-то вроде этого:

((https?|ftp)\:\/\/|www.)((?:[\w\-]+\.)*[\w\-]+)

Это еще не проверяет действительные URL, даже если вы пропустите двойные точки. Я бы посоветовал не использовать регулярные выражения, если используемый вами язык (PHP?) Имеет другие средства проверки URL.

В RFC говорится следующее:

; URL schemeparts for ip based protocols:
ip-schemepart = "//" login [ "/" urlpath ]
login = [ user [ ":" password ] "@" ] hostport
hostport = host [ ":" port ]
host = hostname | hostnumber
hostname = *[ domainlabel "." ] toplabel
domainlabel = alphadigit | alphadigit *[ alphadigit | "-" ] alphadigit
toplabel = alpha | alpha *[ alphadigit | "-" ] alphadigit
alphadigit = alpha | digit
hostnumber = digits "." digits "." digits "." digits
port = digits
user = *[ uchar | ";" | "?" | "&" | "=" ]
password = *[ uchar | ";" | "?" | "&" | "=" ]
urlpath = *xchar ; depends on protocol see section 3.1

; HTTP
httpurl = "http://" hostport [ "/" hpath [ "?" search ]]
hpath = hsegment *[ "/" hsegment ]
hsegment = *[ uchar | ";" | ":" | "@" | "&" | "=" ]
search = *[ uchar | ";" | ":" | "@" | "&" | "=" ]

; Miscellaneous definitions
lowalpha = "a" | "b" | "c" | "d" | "e" | "f" | "g" | "h" |
"i" | "j" | "k" | "l" | "m" | "n" | "o" | "p" |
"q" | "r" | "s" | "t" | "u" | "v" | "w" | "x" |
"y" | "z"
hialpha = "A" | "B" | "C" | "D" | "E" | "F" | "G" | "H" | "I" |
"J" | "K" | "L" | "M" | "N" | "O" | "P" | "Q" | "R" |
"S" | "T" | "U" | "V" | "W" | "X" | "Y" | "Z"
alpha = lowalpha | hialpha
digit = "0" | "1" | "2" | "3" | "4" | "5" | "6" | "7" |
"8" | "9"
safe = "$" | "-" | "_" | "." | "+"
extra = "!" | "*" | "'" | "(" | ")" | ","
national = "{" | "}" | "|" | "\" | "^" | "~" | "[" | "]" | "`"
punctuation = "<" | ">" | "#" | "%" | <">
reserved = ";" | "/" | "?" | ":" | "@" | "&" | "="
hex = digit | "A" | "B" | "C" | "D" | "E" | "F" |
"a" | "b" | "c" | "d" | "e" | "f"
escape = "%" hex hex
unreserved = alpha | digit | safe | extra
uchar = unreserved | escape
xchar = unreserved | reserved | escape
digits = 1*digit
0 голосов
/ 26 января 2010

Использование негативного взгляда - простой способ, если ваш движок его поддерживает:

(?!.*\.\.)((https?|ftp)\:\/\/|www.)(\S+[^.*])

В противном случае вы должны быть более конкретны:

^((https?|ftp)\:\/\/|www.)((\.[^.]|[^.\s])+[^.*])($|\s+)
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...