Как я могу SERDE встроить общий прием файлов в Hive? - PullRequest
0 голосов
/ 12 июня 2018

Мне нужно встроить общий прием файлов в Hive.Файлы очень большие (2 ГБ +), могут быть исправлены или разделены запятыми, файлы ASCII или EBCDIC.Попробовав различные техники с использованием Talend, я смотрю в SERDE.Если я принимаю файлы как есть и использую файл схемы (содержащий порядковый номер, имя столбца, тип, длину), могу ли я создать пользовательский SERDE для десериализации любого входного файла в строки куста?Насколько быстрым это будет?

1 Ответ

0 голосов
/ 18 июня 2018

Задав этот вопрос, я обнаружил, что могу использовать COBOL custom SERDE .Я также смотрю на регулярное выражение SERDE для позиционных файлов.

...