Как получить значение cel в таблице в PDF, отсканированной Kofax, чтобы преуспеть - PullRequest
0 голосов
/ 30 марта 2019

Я новичок в захвате Kofax и работаю над извлечением данных из базовой отсканированной копии счета-фактуры (PDF) с таблицей, содержащей список элементов для индексного файла. Далее следуют следующие шаги:

  1. Создан класс документа и добавлено поле индекса таблицы типа и столбцов таблицы, таких как Поле даты как. Скриншот значения столбца даты в PDF выглядит следующим образом:

enter image description here

  1. Во время проверки все значения полей даты отображаются в одном поле следующим образом:

Date: 12/01/2018 12/02/2018 12/03/2018 12/04/2018

  1. Также, когда значения, экспортируемые в индексный файл, имеют вышеуказанный формат.

Есть ли способ получить значения в каждой ячейке в виде отдельных записей или запятых, разделенных с помощью захвата kofax?

1 Ответ

0 голосов
/ 01 апреля 2019

Обычный ванильный Kofax Capture (KC) не может извлекать данные, организованные в виде таблиц. KC может извлекать статические данные, то есть простые пары ключ-значение (например, номер счета, дата счета, общая сумма).

Конечно, вы можете попробовать извлечь столбец следующим образом: enter image description here

Однако это может привести к потенциальным проблемам в будущем. Что если данные не всегда находятся в одном и том же месте? Что если данные продолжатся на последующих страницах? Что в вашей зоне меньше, чем весь столбец? Что делать, если есть перекрывающиеся тексты? Что делать, если вам нужен еще один столбец с дополнительными данными, по сути, создающий строки, но если в некоторых столбцах имеются огромные пробелы (как на моем скриншоте)?

Если требуется извлечение таблицы, вы можете использовать модули преобразования Kofax (KTM), которые доступны в качестве дополнения к Kofax Capture. В KTM есть более сложные методы извлечения таблиц, которые не ограничиваются отдельными макетами форм.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...