Сканер AWS Glue - все записи в одном столбце с разделителем "~" - PullRequest
0 голосов
/ 20 февраля 2019

У меня много файлов, хранящихся в корзине S3, и я пытаюсь создать каталог данных файла, используя сканер клея AWS.

Проблема, с которой я сталкиваюсь, заключается в том, что все записи находятся водин столбец, и они разделены символом "~" (без заголовков на них).

Нужно ли мне писать пользовательский классификатор grok для файла?Предположим, у меня есть 5 полей, таких как

Customer_ID~LastName~FirstName~TransactionDate~Price

Как мне написать классификатор Грока со всеми этими данными в виде отдельных полей в каталоге данных?

Буду признателен за любую помощь.Спасибо!

...