Как избавиться от дубликатов из cloudantdb? - PullRequest
0 голосов
/ 30 мая 2019

Я новичок в нереляционных базах данных.Я потратил часы, пытаясь погуглить любой способ избавиться от дубликатов из моей облачной базы данных, состоящей из данных Twitter.

Например, на следующем снимке экрана они дублируются в текстовом поле.Есть ли способ отбросить их, используя панель управления Cloudant или любым другим способом?

enter image description here

Спасибо ...

1 Ответ

2 голосов
/ 31 мая 2019

В Cloudant нет удобных ограничений уникальности, которые можно найти в реляционной базе данных. Единственная уникальная вещь - это идентификатор документа. Поскольку вы можете предоставить свой собственный идентификатор документа, вы можете сделать это (скажем) хэдом md5 строки твита. Таким образом, вы получите конфликт, если попытаетесь вставить обман.

В противном случае вам необходимо создать представление, которое генерирует тело (или его хэш) в качестве ключа, и иметь отдельный процесс, который проверяет это представление на наличие дубликатов и удаляет их по мере необходимости, как указано в принятом ответе здесь:

Определение дубликатов в CouchDB

...