Алгоритм распознавания символов и символов кандзи - PullRequest
3 голосов
/ 23 апреля 2010

У меня есть друг, который запускает новый проект. Он хочет иметь возможность использовать какое-то распознавание текста для обнаружения и перевода символов кандзи на другие языки. Для этого он натолкнулся на небольшую кирпичную стену в поиске доступных алгоритмов, поскольку эти символы немного сложнее, чем привычные нам английские символы.

Мы предложили ему начать изучать двумерную свертку и преобразования Фурье, чтобы начать процесс распознавания образов, но он ищет хорошую отправную точку.

К сожалению, мои познания в OCR чрезвычайно ограничены, поэтому любые предложения, которые я могу передать, будут, вероятно, наиболее полезными!

1 Ответ

2 голосов
/ 23 апреля 2010

Посмотрите на nhocr .

(Также есть tesseract , но я не уверен, действительно ли они поддерживают CJK.)

Есть довольно много вопросов с информацией об OCR в SO, например, попробуйте этот поиск .

...