Я начинаю работать над проектом с использованием Cassandra (что я новичок), и я работаю над разработкой схемы. Вопрос, который у меня возник, заключается в том, каковы последствия ввода / вывода для того, чтобы в нем содержалась строка, скажем, с миллионами столбцов, особенно в отношении записей?
Чтобы прояснить, что я пытаюсь сделать, я по сути хочу отследить, к какому домену принадлежит и IP. Один из способов, по которому я думал об этом, - это иметь ряд клавиш типа «google.com», и каждый столбец в строке - это IP-адрес, принадлежащий указанному домену. Кто-то сказал мне, что если ваш столбец очень широкий и вы его измените, то он создаст большое количество операций ввода-вывода, так как в какой-то момент b / c данные должны быть практически перезаписаны, данные неизменны. Это правильно? Я думал, что Кассандра просто запишет измененные данные и только измененные данные в журнал фиксации и в таблицу. Затем, когда данные сбрасываются и происходит сжатие, данные объединяются в новый SSTable для семейства столбцов.