HTML Regex Composition - PullRequest
       14

HTML Regex Composition

0 голосов
/ 06 октября 2010

Я пытаюсь захватить тег img в HTML, используя Regex ...

Таким образом, они должны быть захвачены:

<img/>
< img id = "f" />

Я использовал:

"<\s*img(\s.*?)?/>"

Но это идет не так:

< img id = "/>" />

Любая идея, как, вероятно, захватить тег img ??

Спасибо

Ответы [ 3 ]

2 голосов
/ 06 октября 2010

На серьезном замечании: используйте вместо этого xml-анализатор.

"<\simg\sid\s=\s\"(.*?)\"\s/>"

Кроме того, вы должны использовать набор тестов для регулярных выражений, например regex buddy .

Это также может быть хорошим чтением: RegEx соответствует открытым тегам, за исключением автономных тегов XHTML

0 голосов
/ 06 октября 2010

Вы можете использовать это регулярное выражение

<\ s *? IMG [\ s \ S] * /?>

0 голосов
/ 06 октября 2010
"<\s*img\s(?:.+?\s*=\s*(\"|')?.*?\1\s*)?/>"

Я думаю, что это должно учитывать кавычки.Хотя не проверял.

...