это сильно зависит от базы данных.Обычно «пересечение» является самым быстрым.
Теперь у вас есть небольшая разница между двумя именами в вашей базе данных: «Mr Joel Spolsky» и «J Spolsky»
Это означает предварительную обработку таблицы,чтобы убедиться, что имя совпадает, и, возможно, напишите свой собственный «фонетический» индекс.это кажется неуместным, но если у вас есть совпадение столбца «имя» и «имя», а не «префикс» столбца, что вы делаете?(Мистер и миссис Алекс Джонс).
До того, как вы это узнаете, у вас есть механизм правил, механизм принятия решений и интерфейс для всех «ручных» случаев (которые не являются автоматическими слияниями или определенными не совпадают) и 3 ученика.объединение (или пометка как «не имеющее имя») миллионов адресов на полный рабочий день.
Итак, прежде чем попасть туда, определите, что вы хотите объединить точно , тогда алгоритм можно легко выбрать