Python - парсинг повторяющихся шаблонов из большой строки - PullRequest
0 голосов
/ 29 января 2020

Я пытаюсь разобрать большую строку в группу элементов по заданному шаблону. Шаблон всегда начинается с одних и тех же двух слов и заканчивается цифрой.

Пример:

stringSnippet = "**1111 Text** i want everything here onward.affe .afefa .afeaf .afeaf .afaef words .affe .afefa .afeaf .afeaf .afaef up until here **6**"

Как бы я использовал регулярное выражение для получения всех значений между 1111 Text и числом 6?
И повторите этот процесс, чтобы сгруппировать одинаковые шаблоны из всей строки?

Ответы [ 2 ]

2 голосов
/ 29 января 2020

Если я правильно читаю ваш запрос, регулярное выражение выглядит следующим образом:

r'1111 Text(.*?)6'

Это означает "найти самый короткий блок текста, начинающийся с '1111 Text` и заканчивающийся' 6 ', оставьте весь текст между разделителями.

Вы можете использовать это в re.findall () . Как видно из названия, он найдет все экземпляры этого шаблона в строке.

Возможно, вы захотите или не захотите добавить re.DOTALL, чтобы разрешить захват новых строк между разделителями.

0 голосов
/ 29 января 2020
re.findall('1111 Text(.*?)6', stringSnippet)

Вышеприведенное выражение будет соответствовать приведенному выше шаблону в stringSnippet и вернет все найденные вхождения в виде списка.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...