Ну, я использую соответствующую версию .NET этого распознавания текста. @ http://www.pixel -technology.com / freeware / tessnet2 /
У меня это работает,однако цель этого состоит в том, чтобы перевести номерные знаки, к сожалению, движок действительно не точно переводит некоторые буквы, например, вот изображение, которое я отсканировал, чтобы определить проблемы с символами
Результат:
12345B7B9U ABCDEFGHIJKLMNUPIJRSTUVHXYZ
Поэтому следующие символы переводятся неправильно:
1, O, Q, W
Это не так уж и плохо, однако на моих номерных знаках результат не так велик:
= H4 ODM
= LDH IFW
Fake Test
= NR4 y2k
Как вы могли бы сказать, я пытался уменьшить шум, увеличить контраст и удалить пиксели, которые не являются абсолютно черными,без реальных улучшений.
По-видимому, вы можете «изучить» движок новые шрифты, но ядумаю, мне нужно будет перекомпилировать библиотеку для .NET, также, кажется, это выполняется на ОС Linux, которой у меня нет.
http://www.scribd.com/doc/16747664/Tesseract-Trainingfor-Khmer-LanguageFor-Posting
Так что яЯ решил написать приложение для быстрой консоли исключительно для тестирования, если кто-то захочет его попробовать.Если у кого-то есть какие-либо идеи / графические манипуляции / мысли из библиотеки, я был бы рад услышать их.