Я хотел бы выполнить сканирование с быстрой фильтрацией в оболочке hbase, чтобы получить любые записи, в которых указанное значение столбца c равно нулю или пусто. Мне сказали, что я могу сделать это и в PIG, но я тоже не знаю, как это сделать. Может кто-нибудь, пожалуйста, помогите с любым методом, чтобы решить эту проблему. Я буду, как последний вариант сделать в java, но просто думал, что это будет быстрее?
**TableName, columnFamily, column**
test:table collected:url
Спасибо.
РЕДАКТИРОВАТЬ:
Попробовал следующее:
scan 'test:table',{ COLUMNS => 'collected:url', LIMIT => 10, FILTER => "ValueFilter( =, 'binaryprefix:<>' )"}
Нет результатов, может быть, это работает, но выглядит ли это правильно?
РЕДАКТИРОВАТЬ 2:
Ошибка вернулась:
hbase(main):008:0> scan 'test:table', {FILTER =>
SingleColumnValueFilter.new(Bytes.toBytes('collected'),
Bytes.toBytes('url'), CompareFilter::CompareOp.valueOf('EQUAL'),
Bytes.toBytes(''), true, true), COLUMNS => 'collected:url' }
ArgumentError: wrong number of arguments (6 for 4)