У меня есть таблица на сервере SQL, и в этой таблице около 39 столбцов.Я пробовал sqoop импортировать таблицу в HDFS и Hive, и данные очень грязные и повсюду.В некоторых полях этой таблицы есть данные с разрывами строк, которые, как мне кажется, являются основной причиной создания беспорядочных данных в улье. Как настроить разделение новой строки для некоторых полей в моей команде sqoop.
Я написал в сценарии данные из 1 строки из таблицы SQL, и, как вы можете видеть на скриншоте,это разрывы строк в моих данных.
Я попробовал следующую команду sqoop:
sqoop import --connect "jdbc: sqlserver: //192.169.106.64; database = DRE; имя пользователя= sqoop; пароль = hadoop "--table NCentralAlerts_Temp --hive-import -m 1 --fields-terminated-by \ n
, но это по-прежнему не решает проблему.Как получить чистое представление данных в улье?