В Cloudant нет удобных ограничений уникальности, которые можно найти в реляционной базе данных. Единственная уникальная вещь - это идентификатор документа. Поскольку вы можете предоставить свой собственный идентификатор документа, вы можете сделать это (скажем) хэдом md5 строки твита. Таким образом, вы получите конфликт, если попытаетесь вставить обман.
В противном случае вам необходимо создать представление, которое генерирует тело (или его хэш) в качестве ключа, и иметь отдельный процесс, который проверяет это представление на наличие дубликатов и удаляет их по мере необходимости, как указано в принятом ответе здесь:
Определение дубликатов в CouchDB