Создайте файл конфигурации (например, «буквы») в каталоге tessdata / configs - обычно /usr/share/tesseract/tessdata/configs
или
/usr/share/tesseract-ocr/tessdata/configs
И добавьте эту строку в файл конфигурации:
tessedit_char_whitelist abcdefghijklmnopqrstuvwxyz
... или, может быть, [a-z] работает .. не знаю: -)
Затем вызовите tesseract, подобный этому:
tesseract input.tif output nobatch letters
Это ограничит тессеракт для распознавания только нужных символов