Я пытаюсь понять Кассандру, играя с опубликованным набором данных c. Я вставил 1,5 миллиона строк из CSV в таблицу на своем локальном экземпляре Cassandra, с REPLICATION = {'class': 'SimpleStrategy', 'replication_factor': 1}
Таблица была создана с одно поле как ключ раздела и еще один в качестве первичного ключа
У меня было подтверждение, что обработано 1,5 млн строк. COPY Completed
Но когда я запускаю SELECT или SELECT COUNT (*) в таблице, я всегда получаю максимум 182 строки.  Во-вторых, число записей, возвращаемых с кластеризованными столбцами, кажется, больше, чем в отдельных столбцах , что для меня не имеет смысла. Чего мне не хватает в архитектуре и запросах Cassandra?
Наконец, я также попытался прочитать ту же таблицу Cassandra из оболочки pyspark, и, кажется, она также читает 182 строки.