Самый быстрый способ (1) не вставлять повторяющиеся записи (2) объединять дубликаты в БД Mongo? - PullRequest
0 голосов
/ 04 июля 2011

(1) Какой самый быстрый способ проверить, является ли элемент, который я собираюсь «вставить» в коллекцию MongoDB, уникальным (и если нет, то вставить его)

(2) Для существующей базы данных, какой самый быстрый способ просмотреть все записи и удалить дубликаты, но сохранить одну копию, например, как функцию «set»: {a, b, c, a, a, b} -> {a, b, c}

  • Мне известно, что технически каждая запись уникальна, поскольку они получают уникальный ObjectID
  • . Вы можете считать, что записи являются абсолютно плоскими: списки значений
  • Решения сИндексирование в порядке
  • Я предпочитаю код Python (т. е. Mongo Python API), если это возможно

Спасибо!

1 Ответ

2 голосов
/ 04 июля 2011

(1) Создайте уникальный индекс для связанных столбцов и поймайте ошибку по времени вставки

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...