Я пишу задание mapreduce поверх HBase, используя table mapper. Я хочу пропустить строки, которые не имеют определенных столбцов. Например, если преобразователь считывает данные из семейства «meta», столбца спецификатора «source», преобразователь должен ожидать, что что-то будет в этом столбце. Я знаю, что могу добавить столбцы к объекту проверки, но я ожидаю, что это просто ограничивает, какие строки можно увидеть при сканировании, а не какие столбцы должны быть там.
Какой фильтр можно использовать для пропуска строк без нужных столбцов?
Кроме того, сама концепция фильтра немного странная. Работает ли фильтр построчно или ключ-значение-ключ-значение? Означает ли «фильтровать строку» пропуск строки или ее включение, или просто пропустить ее через фильтр?
Есть ли где-нибудь, где это объясняется более четко, чем hbase javadocs?