Используя Spark, я хочу прочитать файл PDF, который содержит данные в формате таблицы, а результат должен быть в формате структурированных данных (чтобы сохранить его в базе данных)
может предложить любую из прочитанных структурPDF-файл и результат должны быть в структуре данных
Формат PDF выглядит следующим образом нажмите, чтобы посмотреть
ожидаемый результат должен быть в табличном формате