Hadoop 'grep' пример - PullRequest
       7

Hadoop 'grep' пример

0 голосов
/ 06 июня 2011

В примере Hadoop 'grep' (который поставляется с пакетом Hadoop), что является параметром группы. Можете ли вы привести пример для этого.

1 Ответ

2 голосов
/ 06 июня 2011

Отказ от ответственности: я не запускал этот пример и пытаюсь ответить, просто посмотрев на http://wiki.apache.org/hadoop/Grep

Вызов CLI: bin/hadoop org.apache.hadoop.examples.Grep <indir> <outdir> <regex> [<group>], и вы хотите узнать о <group>.

Я подозреваю, что это группировка в регулярных выражениях.(случайная ссылка - http://www.exampledepot.com/egs/java.util.regex/Group.html)

Как отмечено в ссылке Hadoop Grep

Команда работает иначе, чем вызов grep Unix: она не отображает полную совпадающую строку, нотолько соответствующая строка

Из этого следует, что если вы укажете значение <group> (число), оно будет выводить только значение для этой группы.

Дляпример (извлечение из групповой ссылки)

input: aba
regex: (a (b) *) +
группа 0: аба
группа 1: a
группа 2: b

Если значение для <group>равно 1, тогда результат будет a. Группа 0 - это полное совпадение, а не исходная строка. В этом случае это просто совпадение.

hth

...