Я удивлен, что у Тессеракта все хорошо. Немного потренировавшись, вы сможете научиться правильно распознавать строчную букву «l».
Основная проблема, с которой вы столкнулись - это вершина большого символа Т. Горизонтальная линия проходит через 2 (возможно, 3) другие символьные ячейки, и это может вызвать проблемы для любого механизма распознавания, когда он пытается сегментировать символы для распознавания. Обучение может помочь в этом случае.
Следующая проблема - это. и: которые очень легкие / тонкие и, возможно, удаляются с помощью предварительной обработки изображения еще до начала распознавания.
В целом, единственный шанс улучшить результаты с Tesseract - это изучить тренировку. Вот несколько ссылок, которые могут помочь.
Альтернатива Тессеракт OCR Обучение?
Tesseract OCR Библиотека обучающий шрифт
Тессеракт путает два числа