Используйте Regex, чтобы получить содержимое HTML-тега в зависимости от подстроки - PullRequest
0 голосов
/ 25 сентября 2019

Можно ли выбрать тег HTML (не указан) и его содержимое в зависимости от того, есть ли в нем конкретная строка?

Например:

<tagouter>
    <tag> lorem ipsum youtube lorem ipsum</tag> 
    outer text 
    <tag> lorem ipsum youtube lorem ipsum TEXT 2</tag> 
<tagouter>

Ожидаемый результат:

array(array('youtube','<tag> lorem ipsum youtube lorem ipsum</tag>'),array('youtube',<tag> lorem ipsum youtube lorem ipsum TEXT 2</tag>))

С помощью /(\byoutube\b)/ можно будет получить саму строку.Но как получить содержимое, содержащее теги?

1 Ответ

0 голосов
/ 25 сентября 2019

Использование регулярных выражений для получения контента из HTML не очень хорошая идея.См. Этот пост:

RegEx соответствует открытым тегам, за исключением автономных тегов XHTML

Вместо этого используйте HTML-анализатор.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...