Как обнаружить и повернуть изображения в Python - PullRequest
0 голосов
/ 19 июня 2019

У меня есть несколько счетов в формате PDF, которые я пытаюсь проанализировать. Я конвертирую их в изображения и использую ocr для получения текста из изображений. Один из PDF имеет 2 из 3 страниц, которые поворачиваются на 90 градусов. Как обнаружить эти повернутые страницы и правильно повернуть их, чтобы OCR вернул верную информацию?

1 Ответ

0 голосов
/ 19 июня 2019

Когда вы говорите, что они повернуты, будет ли это так же просто, как все они должны быть в портретной ориентации, а некоторые страницы - в альбомной ориентации?Вы должны либо иметь возможность читать метаданные из PDF ориентации страниц, либо, если по какой-либо причине они недоступны, вам может понадобиться использовать эту простую логику для определения, например rotated = image.width > image.height

СПодушка / PIL было бы легко повернуть изображение перед распознаванием:

if rotated:
    image = image.rotate(270)

Предположительно, может быть случай, когда страницы перевернуты, и если у вас нет надежных метаданных из PDF, тогда вам, возможно, придется сначалаOCR с наиболее вероятным направлением (скажем, против часовой стрелки на 90 градусов, как указано выше), и если это не возвращает никакого текста, попробуйте еще раз после поворота на 180 градусов.

...