Здравствуйте, я пишу синтаксический анализатор регулярных выражений Python и пытаюсь написать регулярное выражение, которое выделяет текст между словом QUESTION в большом тексте.
Образец текста
Exam A
QUESTION 1
Blank is designed to help users.
A. baba.
B. caca.
C. sasa.
D. tyty.
Correct Answer: D
Explanation
Explanation/Reference:
QUESTION 2
can I do something?
A. No
B. Yes
Correct Answer: C
Explanation
Explanation/Reference:
QUESTION 3
What does provide?
asdasdasd
import re
import os
import sys
questions_file_text = open("questionguide.txt", "r").read()
Questions = re.findall("(?:(?!QUESTION).|[\n\r])*QUESTION",questions_file_text)
Таким образом, я хочу выбрать все, включая номер вопроса, до следующего появления вопроса. Таким образом, я могу выполнить синтаксический анализ текста, чтобы отформатировать его в json.
Я могу сделать питона, который, похоже, просто не может понять, как работает мой RegEx, может кто-нибудь мне помочь.
Это клест, который я получил
