У меня есть изображение для обработки: сканирование страницы книги.
Я хочу сохранить полезную информацию, включая номера страниц в углах, но обрезать ненужные элементы и сканировать артефакты по краям изображения. Какое решение (желательно на Python) для этого?
Мне нужно либо полное решение для удаления мусора, либо, по крайней мере, способ определить, где начинаются края текстового блока - какая-то библиотека OCR для определения размеров области полезной информации при сканировании страницы.
Спасибо
UPD:
Образец:
https://i.imgur.com/SH8Vqey.png
Я хочу, чтобы была возможность обрезать хорошую часть сканирования, чтобы не было части другой страницы через переплет, никакого черного цвета за пределами страниц, никаких искажений по краям.