У меня есть куча отчетов, которые я собираю вручную каждый день, и они берутся навсегда, поэтому я думал об автоматизации всего процесса.Я буду собирать данные из: (1) HTML, (2) CSV / XLS, (3) PDF.Я в основном собирал только данные из CSV / HTML с помощью PHP, и мне было интересно, есть ли надежные библиотеки или способы получения табличных данных из PDF в PHP?
Я только начал изучать Python и вижу, чтоможет быть хорошей идеей попробовать сделать это с PDFMiner в сочетании с Scrapy.Будет ли это лучше?Или есть другие варианты?
Пожалуйста, дайте мне знать.Спасибо!