Question

Мне было интересно, что может быть самым быстрым и простым способом перехвата текста между тегами в строке.
Например, у меня есть эта строка: Lorem ipsum <a>dolor sit amet</a>, consectetur adipisicing elit, sed do eiusmod tempor incididunt ut labore et dolore magna aliqua.
И мне нужно найти текст, который находится между тегами <a> </a> и  .

Спасибо.

Rox · Answer 1 · 08 июня 2010

Разбор HTML очень и очень труден, потому что веб-страницы редко бывают правильными, и вы найдете много несовпадающих тегов и странных странных вещей.

Используйте HTMLAgilityPack , если этодля страниц реального мира.

Amarghosh · Answer 2 · 08 июня 2010

<a>(.*)</a>.*(.*) будет работать в данном конкретном случае , но в общем случае не стоит разбирать html с помощью регулярных выражений.Вместо этого используйте анализатор HTML / XML.

Попробуйте HTMLAgilityPack : В этом ТАК объясняется, как его использовать.

abatishchev · Answer 3 · 08 июня 2010

.+<a>(.+)</a>.+<b>(.+)</b>.+

Первая группа совпадений будет содержать текст между A-тегами, а вторая группа - между B-тегами.

Соответствие содержимого между тегами в веб-источнике

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 3 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Соответствие содержимого между тегами в веб-источнике

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 3 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы