Я пытался преобразовать изображение PDF в текст PDF в программе Tesseract OCR.Между ними мне нужно проверить обложку и удалить ее из результата.Возможно ли в самом OCR Tessaract идентифицировать титульную страницу на основе определенных свойств титульной страницы (сопоставление текста титульной страницы).или я должен взять весь вывод результатов оптического распознавания текста и предоставить свою логику для сканирования PDF и удаления титульной страницы.Я полностью сбит с толку, и любая помощь будет оценена.