Как искать внутри файлов HDFS - PullRequest
0 голосов
/ 27 апреля 2018

Я хочу иметь возможность искать шаблон строки во всех папках и файлах в определенном каталоге в HDFS. не уверен, как это сделать. ниже не работает.

hadoop fs -ls -R /folder_path/ |grep -i "pattern"

Как мне искать?

1 Ответ

0 голосов
/ 28 апреля 2018

Для файлов в одной папке HDFS вы можете использовать команду hadoop fs -cat. Это не будет искать в подпапках, хотя.

Чтобы проиллюстрировать, что если файлы находятся в папке HDFS с именем /hive-data, можно использовать следующую команду для поиска в файлах в каталоге шаблона:

hadoop fs -cat /hive-data/* | grep -i pattern
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...