Не могу узнать, как использовать check_unique_id - PullRequest
0 голосов
/ 02 февраля 2020

Я вставляю много данных в таблицу elassandra (cassandra). По мере роста моего индекса (более 300 млн документов) скорость вставки снижается. Как я могу видеть, перед вставкой нового документа elassandra ищет документ с тем же идентификатором, и он генерирует огромный IO для чтения. Я генерирую идентификаторы сам, а не автоматизирую c. Я уверен, что идентификатор уникален.

Я бы хотел отключить проверку существования идентификатора. В документации здесь https://elassandra.readthedocs.io/en/latest/operations.html говорится: «ЕСЛИ НЕ СУЩЕСТВУЕТ», так это стоимость транзакции PAXOS. Если вам не нужно проверять уникальность предоставленного идентификатора, добавьте параметр check_unique_id = false. " Я думаю, установка check_unique_id = false может помочь решить мою проблему. Но я не знаю, как это сделать. Я не могу найти, как использовать флаг check_unique_id, я также не нашел его в исходном коде.

...