Извлечение основного каталога из пути с помощью Regex в Hive - PullRequest
1 голос
/ 04 июня 2019

Я использую функцию регулярных выражений в Hive, чтобы найти основную папку.

Я хочу проанализировать "основной" из этого пути к файлу:

/main/one/path/to/hdfs

Это регулярное выражение, которое яб:

regexp_extract(filepath,'(^/[^/]+)',0)

Ответы [ 2 ]

1 голос
/ 04 июня 2019

Вы должны выйти из "/" с помощью "\"

(^\/[^\/]+)

0 голосов
/ 04 июня 2019

Я предполагаю, что мы хотим получить первый каталог после косой черты, который мы могли бы начать с этого простого выражения:

\/(.+?)\/.+

Здесь мы получаем наш main вывод, записанный вэта первая группа захвата:

(.+?)

, которую мы можем просто назвать ее, используя группу 1, и наш код, вероятно, будет выглядеть следующим образом:

regexp_extract(filepath,'\/(.+?)\/.+', 1)

Demo

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...