Я разрабатывал приложение для Android, в котором используется тессерактное оптическое распознавание символов (TCR), и мне было интересно, есть ли способ улучшить результаты для мелкого текста.
Я попытался пересобрать стандартный словарь с моими собственными частыми и обычными списками слов (используя wordlist2dawg) и не увидел улучшения (я даже не могу сказать, помогает ли это!). Я также слышал, что можно изменить порог, при котором tesseract использует словарные слова, но я не знаю, как это сделать.
Если у кого-нибудь есть представление о том, как я могу улучшить результаты, которые дает мне тессеракт, я был бы очень признателен!