У меня есть куча документов в Excel, PDF, DOCX, и все они имеют разные формы / макеты. Я хочу автоматизировать запись этих документов в базу данных.
Я только что прочитал их в pandas и обработал их вручную. ПРОБЛЕМА даже в файлах Excel имеют разные формы и темы, такие как балансы, отчеты о доходах, с разнородными фреймами данных. pdf может быть выписками из банковского счета, заявками, счетами и т. д. c.
Как лучше всего go об этом использовать python?