Как я могу извлечь вопросы из тестового изображения? - PullRequest
0 голосов
/ 25 октября 2019

Мне нужно извлечь вопросительные изображения из тестового изображения. Эти вопросы не расположены должным образом. В данном примере они могут выглядеть, но это меняет каждую страницу.

У меня есть сотни тестов и тысячи вопросов. Мне нужно интегрировать эти вопросы в систему. Они на самом деле PDF (но могут быть легко преобразованы в изображения). Я попытался преобразовать их в HTML, затем извлечь из них информацию, но это не сработало, потому что графика вопроса жестко запрограммирована на фоновом изображении. Единственное оставшееся решение - заставить программу находить вопросы и создавать из них единичные изображения.

Пример документа: paper

Что я хочу: enter image description here

Как я могу это сделать?

Любые решения также принимаются.

...