Как получить таблицы, которые существуют в PDF, используя AWS Textract в java - PullRequest
0 голосов
/ 07 апреля 2020

Я нашел статью ниже, чтобы сделать в python.

https://docs.aws.amazon.com/textract/latest/dg/examples-export-table-csv.html

также я использовал статью ниже, чтобы извлечь текст.

https://docs.aws.amazon.com/textract/latest/dg/detecting-document-text.html

но вышеупомянутая статья помогла получить только текст, я также использовал функцию "block.getBlockType ()" блока, но ни один из блоков не возвратил свой тип как "CELL", даже таблицы есть в image / pdf.

Помогите мне найти java библиотеку, похожую на "boto3" для извлечения всех таблиц.

...