Datacap, как создать массив полей и объединить или избежать разделения листов Excel - PullRequest
0 голосов
/ 28 декабря 2018

Я пытаюсь получить строки документа Excel.Чего я достиг.

1-.Получить файлы .xls, .xlsx2-.Конвертировать эти файлы в изображения TIFF3-.Улучшение изображения для лучшего распознавания текста4-.Определить страницы5-.Создать документы6-.Распознать страницу и поля7-.Заполните поля (это моя проблема)

Например, в таблице типа

Name   | Age | Size
Juan   | 26  | 1.90m
Max    | 25  | 1.85m
Victor | 26  | 1.65m

Мой проект может найти ключевое слово Name, Age & Size и в настройках я могускажите ему, хорошо, значение находится внизу строки и группирует начальные и конечные слова, но оно заполнит только поля имени, возраста и размера первыми значениями ниже и проигнорирует остальные, а в datacap, похоже, нет полятип массива.

enter image description here

На изображении вы можете видеть, что есть только один способ добавить поля, и они являются скалярными (только одно значение),Добавить несколько только добавляет несколько полей одновременно, а не поле с несколькими значениями, ха-ха.

Вот так мои поля извлекаются

enter image description here

Другая проблема, с которой я сталкиваюсь, заключается в том, что мой лист Excel разбивается на части для заполнения формата документа, и я ожидал, что весь лист будет преобразован в 1 документ, а не в 4

enter image description here

На изображении эти 4 страницы изme sheet (в excel)

В документации IBM по-прежнему не хватает информации, на некоторых страницах есть только заголовок и ноль информации.

1 Ответ

0 голосов
/ 05 февраля 2019

согласовано для пункта 1, оно не поддерживает какие-либо поля, такие как массив или что-то более продвинутого уровня.Эта функция действительно нужна, и мы можем увидеть что-то от IBM.

Возвращаясь ко второму пункту, datacap будет преобразовывать Excel в соответствии с печатными страницами, как при печати этого Excel.Вы должны добавить набор правил, чтобы объединить их в один файл. Наиболее распространенный способ сделать это - использовать tiffmerge ootb, предоставленный datacap.

...