OCR для Деванагари (хинди / маратхи / санскрит) - PullRequest
8 голосов
/ 16 января 2010

Кто-нибудь имеет какое-либо представление о недавней работе по оптическому распознаванию символов для индийских сценариев с использованием современных методов машинного обучения? Я знаю о некоторых исследованиях, проводимых в ISI, calcutta, но, насколько мне известно, за последние 3-4 года ничего нового не появилось, и, к сожалению, отсутствует OCR для Деванагари!

Ответы [ 2 ]

3 голосов
/ 15 апреля 2010

К вашему сведению: в New York Times от 2003 года есть статья , в которой упоминается инструмент под названием ILT .

2 голосов
/ 27 января 2010

Это, безусловно, слишком старый, чтобы быть полезным, но круто: видео Инголов, говорящих на санскрите и OCR. ( Даниэль Х.Х. Ингаллс-старший, , профессор и переводчик санскрита и его сын Дэн Ингаллс , специалист по информатике, связанный с Smalltalk и т. Д.) Первая половина - Ингаллс-старший, описывающий проект для автоматически анализировать текст, а второй - Ингаллс-младший, описывающий, как он реализовал OCR для санскрита с нуля.

...