С учетом тестовой строки:
teststr= 'chapter 1 Here is a block of text from chapter one. chapter 2 Here is another block of text from the second chapter. chapter 3 Here is the third and final block of text.'
Я хочу создать список результатов, подобный этому:
result=['chapter 1 Here is a block of text from chapter one.','chapter 2 Here is another block of text from the second chapter.','chapter 3 Here is the third and final block of text.']
Используя re.findall('chapter [0-9]',teststr)
Я получаю ['chapter 1', 'chapter 2', 'chapter 3']
Хорошо, если бы все, что я хотел, были номера глав, но я хочу, чтобы номер главы плюс весь текст до номера следующей главы. В случае с последней главой я хочу получить номер главы и текст до конца.
Попытка re.findall('chapter [0-9].*',teststr)
дает жадный результат: ['chapter 1 Here is a block of text from chapter one. chapter 2 Here is another block of text from the second chapter. chapter 3 Here is the third and final block of text.']
I Я не очень хорошо с регулярными выражениями, поэтому любая помощь будет оценена.