как заменить символы новой строки при выборе из таблицы HIVE - PullRequest
0 голосов
/ 29 декабря 2018

У меня есть таблица формата AVRO в HIVE.Один из столбцов (строковый тип данных) в этой таблице содержит данные с символами новой строки, поэтому, когда я выбираю (используя beeline или pyspark), я получаю несколько строк.Я попробовал опцию REGEXP_REPLACE (col1, "\ n", "") в моем выделении, но он по-прежнему возвращает несколько строк.

Значение для col1, когда я копирую и вставляю в текстовом редакторе, выглядиткак показано ниже:

NY - Enjoy holidays or Enjoy leaves.  
Silver 2000 plan
Silver 2000 plan CSR 1
Silver 2000 plan CSR 2
Gold 600 plan
Enjoy, holidays then leaves for ER, UC and old age only.  Primary holidays not subject to Enjoy.

Что могло бы быть альтернативой здесь?

Ответы [ 2 ]

0 голосов
/ 29 декабря 2018

разрешается с помощью regexp_replace (regexp_replace (col1, '\ r', ''), '\ n', '')

0 голосов
/ 29 декабря 2018

попробуйте

regexp_replace(col1, '\\\\n', "")

Пример

hive> select * from temp.test4;
OK
1   abc\nxyz
Time taken: 0.169 seconds, Fetched: 1 row(s)
hive> select id, regexp_replace(value, '\\\\n', "") from temp.test4;
OK
1   abcxyz
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...