Если ваш проект - это что-то еще, но вы хотите, чтобы в вашем проекте было OCR, вам следует искать сторонние инструменты, которые делают это. Но если ваш проект таков, и вы хотите сделать это самостоятельно, прочитайте этот ответ:
Существует два способа распознавания символов. Онлайн и оффлайн.
Онлайн способ использует ввод данных пером (или мышью). и в автономном режиме используются только пиксели.
Вашим первым шагом будет выбор одного из них. В автономном режиме нет данных пера, это полезная функция. но в автономном режиме вы можете распознавать символы из файлов изображений (созданных с помощью краски и сохраненных или даже отсканированных)
Во-вторых, вы должны предварительно обработать данные (этот шаг только для автономного режима). Вы должны удалить из него шумы, масштабировать его и делать с ним прореживание.
Далее вы должны извлечь полезные функции из предварительно обработанных данных (онлайн или офлайн). для этого вы можете прочитать некоторые статьи об оптическом распознавании символов и особенностях его извлечения. Хорошая презентация PowerPoint о предварительной обработке и извлечении функций здесь . Также pdf
ключевое слово и filetype:pdf
в конце вашего поискового запроса в Google помогут вам!
Тогда вы должны использовать нейронные сети или что-то подобное, чтобы распознать персонажа. входы должны быть извлечены функции.
Но помните, этот проект не прост и может занять некоторое время! (Это был мой проект для персидского языка)