Сбой экспорта Sqoop из HDFS в ORACLE из-за специальных символов в данных - PullRequest
0 голосов
/ 18 декабря 2018

При попытке экспортировать данные из hdfs в oracle, используя следующую команду:

sqoop export --connect --username --table --export-dir --m 4 --verbose - поля ввода заканчиваются на '|'--input-lines-terminated-by '\ n' --input-escaped-by '/' -P - --schema

Получение не может обработать исключение для вводаданные в том виде, как они имеют URL-адреса веб-сайтов, а также _ и дату в некоторых полях данных.

Ниже приведен пример записей в файле hdfs, которые я пытаюсь экспортировать:

compID | website | date_fetched

sam_140|https://www.sam.com/profile_link_sam|20181212
lok_231|https://www.lok.com|20181212

Разбор журналов исключений:

Исключение 1:

Не удается проанализировать вводdata: 'https: /www.sam.comprofile_link_sam' в имени таблицы1028 *

org.apache.sqoop.mapreduce.TextExportMapper.map (TextExportMapper.java:89) ... еще 10 причин: java.lang.IllegalArgumentException: формат отметки времени должен быть гггг-мм-дд чч: mm: ss [.fffffffff] в java.sql.Timestamp.valueOf (Timestamp.java:204) в

Используя задание экспорта sqoop, как мы можем экспортировать приведенные выше примеры данных в Oracle?Пожалуйста, помогите, если я пропускаю любой другой аргумент, чтобы успешно разобрать его.

Спасибо!

...