Я пытаюсь получить строки документа Excel.Чего я достиг.
1-.Получить файлы .xls, .xlsx2-.Конвертировать эти файлы в изображения TIFF3-.Улучшение изображения для лучшего распознавания текста4-.Определить страницы5-.Создать документы6-.Распознать страницу и поля7-.Заполните поля (это моя проблема)
Например, в таблице типа
Name | Age | Size
Juan | 26 | 1.90m
Max | 25 | 1.85m
Victor | 26 | 1.65m
Мой проект может найти ключевое слово Name, Age & Size и в настройках я могускажите ему, хорошо, значение находится внизу строки и группирует начальные и конечные слова, но оно заполнит только поля имени, возраста и размера первыми значениями ниже и проигнорирует остальные, а в datacap, похоже, нет полятип массива.
![enter image description here](https://i.stack.imgur.com/1Ivj9.png)
На изображении вы можете видеть, что есть только один способ добавить поля, и они являются скалярными (только одно значение),Добавить несколько только добавляет несколько полей одновременно, а не поле с несколькими значениями, ха-ха.
Вот так мои поля извлекаются
![enter image description here](https://i.stack.imgur.com/GMd0r.png)
Другая проблема, с которой я сталкиваюсь, заключается в том, что мой лист Excel разбивается на части для заполнения формата документа, и я ожидал, что весь лист будет преобразован в 1 документ, а не в 4
![enter image description here](https://i.stack.imgur.com/GMN6t.png)
На изображении эти 4 страницы изme sheet (в excel)
В документации IBM по-прежнему не хватает информации, на некоторых страницах есть только заголовок и ноль информации.