Предположим, у меня есть следующие данные:
OrderNumber | CustomerName | CustomerAddress | CustomerCode
1 | Chris | 1234 Test Drive | 123
2 | Chris | 1234 Test Drive | 123
Как я могу определить, что столбцы "CustomerName", "CustomerAddress" и "CustomerCode" полностью соответствуют друг другу? Я думаю, что Sql Server Data Mining, вероятно, является подходящим инструментом для работы, но у меня не слишком много опыта с этим.
Заранее спасибо.
UPDATE:
Под "коррелятом" я подразумеваю в смысле статистики, что всякий раз, когда столбец a равен x, столбец b будет y. В приведенных выше данных, последние три столбца коррелируют друг с другом, а первый столбец нет.
Вводом операции будет имя таблицы, а выводом будет что-то вроде:
Column 1 | Column 2 | Certainty
CustomerName | CustomerAddress | 100%
CustomerAddress | CustomerCode | 100%