Я нашел общедоступный латинский <-> португальский словарь в PDF, который я хотел бы преобразовать в обычный текст, проанализировать и использовать в качестве базы данных программы.Однако после некоторого тестирования я немного скептически отнесся.Взгляните на оригинальный файл и на получившийся текст gocr .Есть ли надежда, что я смогу достичь 99% + точности в каком-то методе?Я думал о базе данных reCaptcha, но я думаю, что это собственность Google, не так ли?
Спасибо!