Question

Допустим, я создал таблицу

rowkey (attrId + attr_value) // составной ключ

колонка => документ: документ1, документ: документ2, ...

при использовании функции сканирования я каждый раз получаю по 1 строке внутри итератора, что если квалификатор столбца достигнет миллионов записей. как вы проходите через это, и будет ли проблема с кешем?

спасибо.

sirbrialliance · Answer 1 · 31 мая 2012

Вы можете обойти гигантские выборки строк с помощью комбинации сканов и фильтров столбцов:

Scan s = ...;
s.setStartRow("some-row-key");
s.setStopRow("some-row-key");
Filter f = new ColumnRangeFilter(Bytes.toBytes("doc0000"), true,
                                 Bytes.toBytes("doc0100"), false);
s.setFilter(f);

Источник: http://hadoop -hbase.blogspot.com / 2012/01 / hbase-intra-рядный scanning.html

David · Answer 2 · 26 января 2011

Сканирует выборочные строки.Вы можете квалифицировать сканирование так, чтобы оно выбирало только определенные классификаторы или семейства, но тогда это все, что будет возвращено из сканирования (и вы можете фильтровать только данные, включенные в сканирование).

Если у вас есть потенциально миллионы столбцов в одной строке, это может быть проблемой: это означает, что возврат этой строки может быть очень большой передачей по сети.Если размер строки превышает размер региона, это также может привести к ошибкам OOM на серверах региона, и у вас будет неэффективное хранилище (одна строка на регион).

Однако, игнорируя все это, вы можете выполнить циклстолбцы и классификаторы столбцов в клиенте. Вы можете получить карту из результирующего набора, которая сопоставляет семейства с классификаторами и значениями.Но это, вероятно, не то, что вы действительно хотите сделать

Dave L. · Answer 3 · 05 июня 2012

Вы также можете ограничить количество столбцов в строке, возвращаемой за раз, с помощью Scan.setBatch .

Сканирование и выборка столбцов HBase

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 3 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Сканирование и выборка столбцов HBase

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 3 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы