Мне нужно извлечь вопросительные изображения из тестового изображения. Эти вопросы не расположены должным образом. В данном примере они могут выглядеть, но это меняет каждую страницу.
У меня есть сотни тестов и тысячи вопросов. Мне нужно интегрировать эти вопросы в систему. Они на самом деле PDF (но могут быть легко преобразованы в изображения). Я попытался преобразовать их в HTML, затем извлечь из них информацию, но это не сработало, потому что графика вопроса жестко запрограммирована на фоновом изображении. Единственное оставшееся решение - заставить программу находить вопросы и создавать из них единичные изображения.
Пример документа:
Что я хочу:
Как я могу это сделать?
Любые решения также принимаются.