Я пытаюсь создать выражение, которое будет извлекать URL - PullRequest
0 голосов
/ 17 июля 2010

Я хочу извлечь URL-адреса из веб-страницы. Это сами по себе URL-адреса, а не гиперссылки и т. Д., Это просто текст. Вот некоторые примеры: http://www.example.com, http://example.com, www.example.com и т. Д. Я очень новичок в regex, поэтому я скопировал и вставил, как 20 выражений в сети, все не сработало. Я не знаю, правильно ли я это делаю или нет. Любая помощь будет очень признательна.

Ответы [ 2 ]

0 голосов
/ 17 июля 2010

Я написал сообщение об использовании Regex для поиска ссылок на HTML-странице (целью было использовать JavaScript для открытия внешних ссылок или ссылок на документы, такие как PDF и т. Д. Во всплывающем окне).

Конечное регулярное выражение было: ^ (?: [./] +)? (?: Активы | https?: // (?! (?: Www.)? Интегралист))

Полный пост здесь: http://www.integralist.co.uk/javascript/regular-expression-to-open-external-links-in-popup-window/

Решение не будет идеальным, но может помочь вам указать правильное направление.

Отметить

0 голосов
/ 17 июля 2010

Вы, вероятно, не избегаете своих . с. Вам нужно использовать \. для каждого.

Взгляните на strfriend.com . Он имеет пример URL и представляет его графически.

Пример, который он предлагает:

^((ht|f)tp(s?)://|~/|/)?(\w+:\w+@)?([a-zA-Z]{1}([\w-]+.)+(\w{2,5}))(:\d{1,5})?((/?\w+/)+|/?)(\w+.\w{3,4})?((\?\w+=\w+)?(&\w+=\w+)*)?

...