Чтение PDF с текстом, собственноручными подписями и заполнением полей - PullRequest
0 голосов
/ 12 сентября 2018

Я не видел ни одного ответа на этот вопрос в stackoverflow или после поиска в Google.

Какие пакеты R я должен использовать для чтения PDF-файлов в R, которые содержат рукописные подписи и поля, которыебыли заполнены?

У меня есть большой набор данных PDF-файлов, которые в основном представляют собой опросы, требующие стандартных вещей.Имя, номер, домашний адрес, подпись ... хорошим примером того, как выглядят эти PDF-файлы, являются приложения Mass Health Applications https://www.mass.gov/files/2017-08/app.pdf.

1) Существуют ли пакеты для R, которые могут читать PDF-файлы с подписями или заполнением полей?

2) Должен ли я сохранить эти PDF-файлы в другом формате, например, в формате JPEG?

1 Ответ

0 голосов
/ 20 января 2019

Если вы не работаете с большим количеством документов с одинаковым почерком, технология распознавания текста недостаточно развита, чтобы превращать подписи в машиночитаемые символы.Компьютерное зрение еще не пришло.Лучше всего нанять фирму для ручной расшифровки основной информации.

...