Предположим, у нас есть что-то вроде этого:
<div1>
<h1>text1</h1>
<h1>text2</h1>
</div1>
<div2>
<h1>text3</h1>
</div2>
Используя RegExp, нам нужно получить text1
и text2
, но не text3
.
Как это сделать?
Заранее спасибо.
РЕДАКТИРОВАТЬ: Это всего лишь пример.Текст, который я анализирую, может быть простым текстом.Главное, что я хочу сделать - это перечислить все строки из определенного раздела документа.Я привел этот HTML-код, например, так как он очень похож на то, что мне нужно получить.
(?siU)<h1>(.*)</h1>
будет анализировать все три строки, но как получить только первые две?
EDIT2: Вот еще один довольно тупой пример.:)
Section1
This is a "very" nice sentence.
It has "just" a few words.
Section2
This is "only" an example.
The End
Мне нужны слова в кавычках из первого, но не из второго раздела.
Еще раз, (?siU)"(.*)"
возвращает слова в кавычках из всего текста, а мне нужны только слова между словами Section1
и Section2
.
Это для приложения "Rainmeter" , которое, очевидно, использует синтаксис Perl regex.
Извините, но я не могу 'объяснить это лучше.:)