Следующая функция regexp_extract работает в Impala, но не работает, когда я использую ее в Hive:
select regexp_extract("efwe FR wefwef", '.*?([[:upper:]]+).*?', 1)
Результат в Impala равен FR
(как и следовало ожидать, т.е. верхняясимволы регистра из первой группы)
Результат в Hive: e
(не то, что я ожидал)
Кто-нибудь может объяснить, почему это так?
Изучив эту проблему, я прочитал, что преобразование регулярного выражения в регулярное выражение в стиле Java может помочь (http://www.regexplanet.com/advanced/java/index.html). Но насколько я знаю, регулярное выражение в стиле Java такое же, как и у меня.