Я пытаюсь Cassandra заменить mysql для большого набора данных (2,5 ТБ / 5 миллиардов строк), который я не могу масштабировать больше на одном сервере.
Я вставляю / обновляю несколько миллионовстроки каждый час.В настоящее время я вставляю и запрашиваю один за другим в cassandra, потому что я не знаю, в каком разделе есть данные, и группировка их кажется медленнее.Но один за другим я не могу сравниться со скоростью одного сервера MySQL даже с 3 узлами Кассандры.
В MySQL я могу выполнять пакетную обработку, потому что я знаю, что она хранит все на одном сервере.Возможно ли, используя значение первичного ключа, определить раздел на стороне клиента, чтобы я мог более эффективно группировать запросы с помощью BATCH или SELECT..IN?
Я имею в виду, учитывая группу PKкак 1, 2, 3, 4, 5, 6 ... и N серверов, я хотел бы знать, что, скажем, строки 1, 3, 5 находятся в одном разделе, поэтому я могу группировать их в своих запросах.Это возможно с кассандрой?