Я работаю над импортом данных из Mysql в Hive с использованием Sqoop.
Однако у меня возникают некоторые проблемы с разделителями.На самом деле, я знаю, что смогу решить свою проблему, используя правильный разделитель для моей таблицы Hive, поэтому он будет хорошо читать файлы, которые я ему подаю.
Но я искал несколько часов и все ещене могу найти какую-либо документацию о том, какие символы я мог бы использовать в качестве разделителя полей?!
Не могли бы вы помочь мне точно определить, какие символы я могу использовать в качестве разделителя полей?и какой формат / кодировку использовать для его указания?
В официальной документации Hive по слиянию я могу найти только следующее:
row_format
: DELIMITED [FIELDS TERMINATED BY char [ESCAPED BY char]] [COLLECTION ITEMS TERMINATED BY char]
[MAP KEYS TERMINATED BY char] [LINES TERMINATED BY char]
[NULL DEFINED AS char] -- (Note: Available in Hive 0.13 and later)
| SERDE serde_name [WITH SERDEPROPERTIES (property_name=property_value, property_name=property_value, ...)]
Но что означает "char"?
Заранее спасибо!