Я создал приложение, которое находит дубликаты записей, используя DUKE
Код:
public static void main(String[] args) throws IOException, SAXException
{
Configuration config =
ConfigLoader
.load("<path>/src/main/recources/namebase.xml");
Processor proc = new Processor(config);
proc.addMatchListener(new PrintMatchListener(true, true, true, true, config.getProperties(),
true));
proc.deduplicate();
proc.close();
}
Работает нормально, теперь можно использовать случай, чтобы найти дубликаты записей и удалить их. PrintMatchListener может печатать только записи. Итак, у меня есть два вопроса:
- Как выполнить действие над дублирующей записью?
- Повторяющаяся логика говорит, что запись «A» похожа на «B», а также говорит, что «B» похожа на «A». Мне нужно только одно отношение, чтобы я мог удалить эти записи. Может кто-нибудь предложить какую-либо стратегию.