Кто-то дал мне полный набор удивительной информации. Это 200-мегабайтные изображения отсканированных объявлений, которые датируются 40-ми годами. Я хочу оцифровать это, но я ничего не знаю об оптическом распознавании. Некоторые из ранних материалов едва читаемы человеком, не говоря уже о машине. Это также на иврите.
Я ищу совет о том, как подойти к этому. Хорошее предложение о книгах, статьях, библиотеках кодов или программном обеспечении (все они должны быть свободно доступны в Интернете). Я хорошо знаю C ++ и Python и могу выбрать другой язык, если это необходимо.
Спасибо.