1) Очистка : я бы посоветовал вам загрузить данные в файлах CSV в промежуточную базу данных и очистить их оттуда до того, как они попадут в базу данных, к которой выподключите Табло к.Таким образом, вы можете сохранить исходные файлы, которые вы можете в конечном итоге перезагрузить при необходимости.Я не уверен, что такое «традиционный стек ETL Back to Front», но инструмент ETL, такой как Microsoft SSIS или Pentaho Data Integrator (бесплатно), поможет вам в создании этих процессов, и вы сможете периодически запускать задания ETL.или каждый раз, когда новый файл загружается в каталог.Вот хороший пример такого процесса: https://docs.microsoft.com/en-us/sql/2014/integration-services/lesson-1-create-a-project-and-basic-package-with-ssis
2) " Mapping ": у вас должна быть модель данных, вероятно, размерная модель , построенный на базе данных, к которой Tableau подключается.Эта модель данных должна хранить чистые и "моделируемые бизнесом" данные.Вы должны выполнять поиск (соединения / сопоставления) при преобразовании ваших данных, чтобы вы могли загрузить их в модель данных.Использование Tableau для исследования размерной модели чистых данных также будет лучше для UX / производительности.
Общий поток будет выглядеть примерно так: CSV -> Промежуточная база данных -> Clean / Transform / Map -> Модель бизнес-данных (база данных) -> Таблица