Чтобы извлечь заголовок и временной интервал в примере ввода текста 1, я использовал регулярное выражение (1) ниже. Это правило больше нельзя было использовать, например, для текста 2, поэтому я изменил регулярное выражение на (2). Хотя это работает, мне интересно, если это самый эффективный способ. Поэтому мой вопрос: можно ли улучшить правило (2). Обратите внимание, что текст «(некоторые замечания)» в примере 2 должен быть частью заголовка.
Входной текст:
<h2>Some title (09:00 - 10:00)</h2> (example 1)
<h2>Some title (some remark) (10:00 - 11:00)</h2> (example 2)
Регулярное выражение:
<h2>(?<title>[^(]+)(?<timespan>[^<]+)</h2> (1)
<h2>(?<title>[^<]+)(?<timespan>\(\d[^<]+)</h2> (2)