Скажите, у меня есть данные о некоторых людях.Это может включать имя, DOB, адрес, адрес электронной почты и т. Д. Предположим, что в этих данных нет уникальных идентификаторов (например, столбец идентификатора), но также предполагается, что повторяющихся строк нет.Мне нужно выяснить минимальный набор полей, которые я могу использовать для запроса этих данных и возврата уникальной строки.
Примером решения может быть: «Я могу сделать запрос, который задает имя, имя пользователя, адрес электронной почты и почтовый индекс, и который будет возвращать ровно одну или ноль строк.»
Я спросил это так, чтобы это имело смысл?Я ищу технику, алгоритм или программный пакет, который бы решал эту проблему для данного набора данных.Все, что может дать ответ, сработает.Спасибо!
ПРИМЕРНЫЕ ДАННЫЕ (реальные вещи гораздо сложнее):
FNAME LNAME DOB ZIP email
John Smith 1/1/12 77777 dude@fake.com
Sean Smith 1/2/08 77777 dude@fake.com
Sean William 4/2/07 77789 stuff@fake.com
Richard Ross 1/1/12 78989 foo@fake.com
Решением для этого набора данных будет (FNAME, LNAME) или (EMAIL, DOB) или(EMIAL, FNAME).