Как я могу удалить все дубликаты записей, кроме одной, чтобы сохранить свои данные в ElasticSearch? - PullRequest
0 голосов
/ 10 февраля 2020

Я новичок в ElasticSearch. Проект, который я собираюсь показать вам, является учебным проектом. Я мог бы использовать вашу помощь для дедупликации записей, которые были зарегистрированы 10 раз в течение полдня.

Я пробовал разные вещи, которые не работают для меня (скрипт python с именем es-dedupe () https://github.com/deric/es-dedupe), запрос ElasticSearch, ...)

Вот наглядное описание моей проблемы, которое будет более красноречивым: img-duplicates-records

По вашему мнению, как я могу удалить все дубликаты записей, кроме одной, чтобы сохранить мои данные?

Большое спасибо

Тьерри

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...