, хотя select * from table
может работать, более эффективным способом может быть чтение данных по диапазонам токенов с запросом, подобным select * from table where token(part_key) > beginRange and token(part_key) <= endRange
. Соединитель Spark Cassandra работает аналогично - он получает список всех доступных диапазонов токенов, а затем извлекает данные из каждого диапазона токенов, но отправляет их непосредственно на узел, который содержит этот диапазон токенов (в отличие от select * from table
, который извлекает вседанные через узел координатора).
Необходимо соблюдать осторожность при расчете границ токенов, особенно для начала и конца полного диапазона. Вы можете найти пример Java-кода в моем репозитории (его слишком долго вставлять здесь).