Похоже, вам просто нужно использовать несколько простых групп захвата в одном запросе регулярного выражения.Нет необходимости делать два отдельных выражения:
.*(<div>([\w\s]+)<\/div>).*
Полное совпадение: This is a <div> simple div </div> test /n
Группа 1: <div> simple div </div>
Группа 2: simple div
Если вы используете python, вы всегда можете использовать str = str.strip()
, чтобы обрезать лишние пробелы в группе 2.