Как прочитать PDF-файл в спарк - PullRequest
1 голос
/ 12 апреля 2019

Используя Spark, я хочу прочитать файл PDF, который содержит данные в формате таблицы, а результат должен быть в формате структурированных данных (чтобы сохранить его в базе данных)

может предложить любую из прочитанных структурPDF-файл и результат должны быть в структуре данных

Формат PDF выглядит следующим образом нажмите, чтобы посмотреть

ожидаемый результат должен быть в табличном формате

...