Извлечение ключей Кассандры - PullRequest
8 голосов
/ 30 марта 2010

Предположим хранилище данных Cassandra с 20 строками с ключами строк с именем "r1" .. "r20".

Вопросы:

  • Как получить ключи строк первых десяти строк (r1 до r10)?

  • Как мне получить ключи строк следующих десяти строк (r11 до r20)?

Я ищу аналогию с Кассандрой:

SELECT row_key FROM table LIMIT 0, 10;
SELECT row_key FROM table LIMIT 10, 10;

Ответы [ 3 ]

8 голосов
/ 30 марта 2010

Взгляните на:

list<KeySlice> get_range_slices(keyspace, column_parent, predicate, range, consistency_level)

Где ваш кортеж KeyRange (start_key, end_key) == (r1, r10)

1 голос
/ 12 июня 2012

На основании моих тестов нет порядка для строк (в отличие от столбцов). CQL 3.0.0 может получать ключи строк, но они не различаются (должен быть способ, которого я не знаю). В моем случае я не знаю, какой у меня диапазон ключей, поэтому я попытался получить все ключи как с помощью Hector, так и Thrift и отсортировать ключи позже. Тест производительности с CQL 3.0.0 для 100000 столбцов на 200 строк составлял около 500 миллисекунд, Гектор - около 100, а экономия - около 50 миллисекунд. Мой ключ строки здесь целое число. Код Гектора следующий:

public void qureyRowkeys(){
    myCluster = HFactory.getOrCreateCluster(CLUSTER_NAME, "127.0.0.1:9160");
    ConfigurableConsistencyLevel ccl = new ConfigurableConsistencyLevel();
    ccl.setDefaultReadConsistencyLevel(HConsistencyLevel.ONE);
    myKeyspace = HFactory.createKeyspace(KEYSPACE_NAME, myCluster, ccl);
    RangeSlicesQuery<Integer, Composite, String> rangeSlicesQuery = HFactory.createRangeSlicesQuery(myKeyspace, IntegerSerializer.get(), 
            CompositeSerializer.get(), StringSerializer.get());
    long start = System.currentTimeMillis();
    QueryResult<OrderedRows<Integer, Composite, String>> result =
      rangeSlicesQuery.setColumnFamily(CF).setKeys(0, -1).setReturnKeysOnly().execute();
    OrderedRows<Integer, Composite, String> orderedRows = result.get();
    ArrayList<Integer> list = new ArrayList<Integer>();
    for(Row<Integer, Composite, String> row: orderedRows){
        list.add(row.getKey());
    }

    System.out.println((System.currentTimeMillis()-start));
    Collections.sort(list);
    for(Integer i: list){
        System.out.println(i);
    }
}

Это код Thrift:

public void retreiveRows(){
    try {
        transport = new TFramedTransport(new TSocket("localhost", 9160));
        TProtocol protocol = new TBinaryProtocol(transport);
        client = new Cassandra.Client(protocol);
        transport.open();
        client.set_keyspace("prefdb");
        ColumnParent columnParent = new ColumnParent("events"); 
        SlicePredicate predicate = new SlicePredicate();
        predicate.setSlice_range(new SliceRange(ByteBuffer.wrap(new byte[0]), ByteBuffer.wrap(new byte[0]), false, 1));              
        KeyRange keyRange = new KeyRange();  //Get all keys
        keyRange.setStart_key(new byte[0]);
        keyRange.setEnd_key(new byte[0]);
        long start = System.currentTimeMillis();
        List<KeySlice> keySlices = client.get_range_slices(columnParent, predicate, keyRange, ConsistencyLevel.ONE);
        ArrayList<Integer> list = new ArrayList<Integer>();
        for (KeySlice ks : keySlices) {
                 list.add(ByteBuffer.wrap(ks.getKey()).getInt());
        }    
        Collections.sort(list);
        System.out.println((System.currentTimeMillis()-start));
        for(Integer i: list){
            System.out.println(i);
        }

        transport.close();
    } catch (Exception e) {
        e.printStackTrace();

    }
}
0 голосов
/ 05 июня 2012

Сначала вы должны изменить cassandra.yaml в версии cassandra1.1.o, где вы должны установить следующее:

partitioner: org.apache.cassandra.dht.ByteOrderedPartitioner

Во-вторых, вы должны определить следующее:

create keyspace DEMO with placement_strategy =
  'org.apache.cassandra.locator.SimpleStrategy' and
  strategy_options = [{replication_factor:1}];

use DEMO;

create column family Users with comparator = AsciiType and
  key_validation_class = LongType and
  column_metadata = [
    {
      column_name: aaa,
      validation_class: BytesType
    },{
      column_name: bbb,
      validation_class: BytesType
    },{
      column_name: ccc,
      validation_class: BytesType
    }
  ];

Наконец, вы можете вставить данные в кассандру и выполнить запрос диапазона.

...