Отказ от ответственности: я не запускал этот пример и пытаюсь ответить, просто посмотрев на http://wiki.apache.org/hadoop/Grep
Вызов CLI: bin/hadoop org.apache.hadoop.examples.Grep <indir> <outdir> <regex> [<group>]
, и вы хотите узнать о <group>
.
Я подозреваю, что это группировка в регулярных выражениях.(случайная ссылка - http://www.exampledepot.com/egs/java.util.regex/Group.html)
Как отмечено в ссылке Hadoop Grep
Команда работает иначе, чем вызов grep Unix: она не отображает полную совпадающую строку, нотолько соответствующая строка
Из этого следует, что если вы укажете значение <group>
(число), оно будет выводить только значение для этой группы.
Дляпример (извлечение из групповой ссылки)
input: aba
regex: (a (b) *) +
группа 0: аба
группа 1: a
группа 2: b
Если значение для <group>
равно 1
, тогда результат будет a
. Группа 0 - это полное совпадение, а не исходная строка. В этом случае это просто совпадение.
hth