Я новичок в Hive и создаю внешние таблицы в CSV-файле. Одна из проблем, с которыми я сталкиваюсь, это значения, которые содержат несколько запятых в самой строке. Например, файл csv содержит следующее:
Файл CSV
Когда я создаю внешнюю таблицу в Hive, поскольку в столбце «имя» есть столбцы, он смещает первое имя вправо, добавляя другой столбец. Это сбрасывает все данные при просмотре таблицы в Hive.
Результат внешней таблицы в Hive
Могу ли я что-нибудь добавить в свой сценарий, чтобы сохранить запятые, а также сохранить имя и фамилию в одном столбце при создании внешней таблицы? Спасибо всем заранее - я очень новичок в Hive.
CREATE EXTERNAL TABLE database.table name (
ID INT,
Name String,
City String,
State String
)
ROW FORMAT DELIMITED
FIELDS TERMINATED BY ','
STORED AS TEXTFILE
LOCATION '/xyz/xyz/database/directory/'
TBLPROPERTIES ("skip.header.line.count"="1");