Поля фильтра в XML-файле сканера представляют собой строки, отформатированные в формате JSON. Поскольку в JSON для фильтра содержится много кавычек, я рекомендую использовать отдельный файл для параметра -d curl, чтобы избежать одинарных кавычек .
curl -v -H "Content-Type:text/xml" -d @args.txt http://hbasegw:8080/table/scanner
Где файл args.txt
:
<Scanner startRow="cm93MDE=" endRow="cm93MDg=" batch="1024">
<filter>
{
"latestVersion":true, "ifMissing":true,
"qualifier":"Y29sMQ==", "family":"ZmFtaWx5",
"op":"EQUAL", "type":"SingleColumnValueFilter",
"comparator":{"value":"MQ==","type":"BinaryComparator"}
}
</filter>
</Scanner>
Как вы узнаете, как должна выглядеть строка фильтра JSON? Вот простой способ с помощью кода Java, который выделяет строковый фильтр, заданный стандартным объектом Filter из Java API HBase.
SingleColumnValueFilter filter = new SingleColumnValueFilter(
Bytes.toBytes("family"),
Bytes.toBytes("col1"),
CompareFilter.CompareOp.EQUAL,
Bytes.toBytes("1")
);
System.out.println(ScannerModel.stringifyFilter(filter));
Обратите внимание, что JSON и XML требуют данных, закодированных в Base64. Я протестировал приведенную выше команду curl на столе, и она работала просто отлично.
Если вам интересно, да, API-интерфейс REST для сканеров еще не настолько удобен для разработчиков, насколько это возможно.