Итак, я довольно новичок в тессеракте, и у некоторых людей были такие же проблемы, как у меня на этом форуме, но я не смог найти удовлетворительное решение, поэтому я отправляю этот вопрос.
У меня есть фотографии от уличная камера, и я хочу получить метки времени отснятого материала. После вырезания отметок времени они выглядят так:
Я подхожу к этой проблеме, используя tesseract с R:
library(tesseract)
library(magick)
eng <- tesseract("eng")
input <- image_read("image from above")
Используя basi c tesseract, я получаю:
input %>% tesseract::ocr(,engine = eng)
# [1] "SRE SAA PRO 206197180731 17:33:88\n"
Очевидно, это не сильно помогает. Поэтому, после прочтения вопроса, я попытался это сделать:
text <- input %>%
image_resize("2000x") %>%
image_convert(type = 'Grayscale') %>%
image_trim(fuzz = 40) %>%
image_write(format = 'png', density = '300x300') %>%
tesseract::ocr()
cat(text)
# es bt i deen | ee) eee i ae 2s ee ee ee eee ec ee |
Этот результат еще хуже, что действительно расстраивает. Как мне получить правильный результат? Любая помощь горячо приветствуется:)
РЕДАКТИРОВАТЬ
@ Макс Тефлон ответил на вопрос для этого примера. Однако я понял, что некоторые изображения по-прежнему читаются неправильно, например
Может Кто-нибудь еще улучшит свое решение?