для получения содержимого из XML / HTML наилучшим из возможных способов является XPath, вы можете направить запрос на получение элемента в DOM, который содержит необходимые данные.
Если HTML - это ваш контент, тогда я предлагаю вам иметь атрибут, который указывает, что это имя книги.
, вы можете использовать запрос XPath, например,
// p [@ class = 'p1'] / b
Условием для XPath является то, что HTML-файл должен иметь правильный закрывающий тег.
Но если вы хотите использовать регулярное выражение, используйте это
.+<p class=\"p1">
Это выражение будет соответствовать классу p1, и вам нужно получить конечный индекс для этого выражения, чтобы получить позицию тега b после тега p.
U можете попробоватьвыражение в
http://www.gskinner.com/RegExr/