Question

У меня проблемы с написанием регулярного выражения.
Мне нужно получить строку, содержащуюся между <cite></cite> тегами, я использовал этот шаблон
'/>(.*)<\/cite>/', но из-за изменившихся потребностей этот тег может теперьсодержать или нет атрибут title с переменным содержимым, и ему могут предшествовать или нет другие теги.

Некоторые примеры возможных строк:
* <cite>Jhon</cite>
* <cite title="a title">Jhon</cite>
* <cite title="another title">Jhon</cite>
* <blockquote>....<cite title="title">Jhon</cite></blockquote>

Таким образом, мой шаблон больше не работает, так как, например, из последней строки он будет принимать что-нибудь между > тега <blockquote>и </cite>.

Как мне изменить свое регулярное выражение, чтобы получить Jhon из этих строк?

ashishmohite · Answer 1 · 03 июля 2019

Это должно сделать это

<cite[^>]*>([^<]+)<\/cite>

Пояснение

<cite[^>]*> соответствует, пока > не будет найдено (Non Greedy)
([^<]+) совпадение, пока не будет найдено < (сгруппировать средний текст). Считайте первую группу совпадений
<\/cite> найден закрывающий тег совпадения </cite> найден

вот демо https://regex101.com/r/6RtBfC/1

PS Использование регулярных выражений для разбора тегов HTML не рекомендуется

CinCout · Answer 2 · 03 июля 2019

EDIT: обновлено регулярное выражение для захвата нескольких тегов, присутствующих в одной строке.

Использование регулярного выражения для анализа XML является идеей плохой .Если вы все еще заинтересованы в решении на основе регулярных выражений, подойдет следующее:

<cite.*?>(.*?)<\/cite>

Все, что я делаю, - это использование начала тега <cite> в моем регулярном выражении,наряду с любыми атрибутами, которые он может содержать.Ленивый подход используется для захвата нескольких тегов, доступных в одной строке.

Демо

Получить содержимое между тегами с переменным атрибутом

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 2 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Получить содержимое между тегами с переменным атрибутом

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 2 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Нет похожих вопросов