Какие-либо инструменты, сделанные для сравнения данных в файлах дампа? - PullRequest
0 голосов
/ 13 мая 2011

Этот вопрос немного похож на этот один, но более конкретный.Я хотел бы протестировать процесс ETL, получив визуализацию различий в двух файлах дампа.Файлы дампа содержат всю базу данных.Различия не будут заключаться в схеме, поскольку такие сравнения легко провести вручную, но довольно небольшие различия в данных.

Существуют ли инструменты для этого?Визуализация, которую я представляю, может выглядеть примерно так:

Столбец 1 имеет разницу в 0,02% в 10 строках.в каждой строке.

Существует ли такой инструмент.

1 Ответ

1 голос
/ 13 мая 2011

Текстовые утилиты, как правило, являются лучшим выбором.

Но если бы я тестировал процесс ETL, я бы не хотел тестировать весь дамп сразу. (В моем случае это были бы миллионы строк.) Я бы предпочел автоматизировать выгрузку каждой таблицы в отдельный файл. Тогда легко определить, идентичны ли две версии данных из таблицы.

cmp table.old table.new

cmp не выводит, если файлы идентичны. diff скажет вам, где различия.

diff table.old table.new

Я использую Cygwin , когда мне нужно сделать это под Windows.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...