Извлечение данных из PDF-форм с помощью Tabulizer (R) - PullRequest
0 голосов
/ 26 сентября 2019

У меня есть несколько файлов pdf, которые необходимо извлечь из (таблиц) данных, но некоторые поля данных внутри таблиц pdf были заполнены в виде формы.При использовании пакета tabulizer я могу извлечь таблицу и все данные, кроме полей таблицы, которые были в виде формы.В этом случае табулизатор возвращает значение NA, где ожидалось число.Имеется ли обходной путь для извлечения данных типа формы из таблицы с помощью табулизатора?или, может быть, чтение файла .fdf формы PDF и извлечение данных оттуда? Здесь - это таблица для извлечения данных, где столбец «VALOR» заполняется в виде формы в формате PDF.Но программа возвращает это вместо:

     CÓD..GMT VALOR
1    PI1-RW    NA
2    PI1-SA    NA
3     PI3-F    NA
4    PI3-JW    NA
5   PI2-FVW    NA
6     PI1-L    NA
7     PI2-L    NA
8    PI10-L    NA
9    PI1-JW    NA
10   PI2-JW    NA
11  PI1-FVW    NA
12    PI1-G    NA
13     10P1    NA
14     09P1    NA
15     10P2    NA
16     09P2    NA
17     09P3    NA
18     09P4    NA
19     10P3    NA
20     09P5    NA
21     03P1    NA
22     10P4    NA
23    49FT1    NA
24    27PJ1    NA
25    27PJ2    NA
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...