У меня есть требование, чтобы мне нужно было получать данные из нескольких файлов с разными форматами, полностью неорганизованными и имеющими произвольно названные поля. Преобразовать эти данные в один формат и сохранить в соответствующих полях таблицы в базе данных. Я знаю концепцию ETL, но я понятия не имею, какую логику c мне следует использовать, потому что это что-то совершенно новое для меня и никогда раньше не работало над чем-то подобным. Кто-нибудь может подсказать мне, как я могу сравнить случайные и необработанные данные с полями таблицы базы данных?
Например: Файл 1 имеет 3 столбца: Имя Cust | Номер | Email
Файл 2 имеет те же поля, но называются по-разному, например: Имя клиента | нет. | email-id
Так что мне просто нужно знать, как это можно сделать или есть ли лучший вариант, чем ETL, для этого требования.
Заранее спасибо.