Я пытаюсь создать «Сканер викторин», который использует OCR для сканирования онлайн-опросов, чтобы я мог самостоятельно составлять тесты из онлайн-источников, чтобы иметь возможность отвечать на них в автономном режиме. Я устал от копирования и вставки и просто использую OCR.
На данный момент у меня нет проблем с частью OCR. У меня возникли проблемы с тем, что мне нужно отделить вопросы от выбора и от выбора правильного и неправильного. Ниже приведен упрощенный код моей попытки их разделения.
Мне нужно, чтобы они были разделены, потому что я хочу экспортировать их в электронную таблицу в Excel. Очень нужна ваша помощь, как всегда, сообщество stackoverflow
import re
scannedmcq = 'Insert Question Here @ A(correct) > B > C > D' #Output of my OCR script
# What if this is the new string
# 'Insert Question Here > A > B > C @ D'
# The Delimiter @ Is the correct answer while > is the wrong answer
# How to Identify and print which part of the string has the delimiter @
text = re.split(r'[@>]\s*', line)
# Manually Printing the strings
print(text[0])
print(text[1])
print(text[2])
print(text[3])
print(text[4])
пример теста онлайн