Хотя у него есть некоторые недостатки и потенциальные проблемы, если вы много очищаете или преобразуете, я обнаружил, что вы можете использовать входной файл в обоих направлениях, заново сгенерировав входной файл из схемы (звездочек). Затем просто сравнив входной файл с выходным файлом. Может потребоваться некоторый массаж, чтобы привести их в соответствие (один дополнен левым, другой - правым).
Как правило, у меня была программа, которая использовала ту же компоновку, что и ETL, и выполняла сравнение, игнорируя выравнивание внутри поля. Кроме того, файлы могут быть отсортированы - есть сортировка командной строки, которую я использовал.
Если ваш ETL выполняет преобразование неправильно и вы преобразовываете неправильно, все еще возможно, что этот метод не показывает все проблемы в DW, и я бы не стал утверждать, что он имеет полное покрытие, но это довольно хороший первый удар при модульном тесте регрессии для каждой нагрузки.