Я поигрался с AWS Glue для быстрой аналитики, следуя инструкции здесь
Хотя я смог успешно создавать сканеры и обнаруживать данныев Афине у меня были проблемы с типами данных, созданными сканером.Типы данных date
и timestamp
считываются как типы данных string
.
Вслед за этим я создал задание ETL
в GLUE, используя источник данных, созданный искателем, в качестве входных данных ицелевая таблица в Amazon S3
В рамках преобразования преобразования я преобразовал типы данных даты и отметки времени как string
в timestamp
, но, к сожалению, ETL преобразовал эти столбцынабирает NULLS
.Я обдумывал использование классификаторов с GROK
выражениями, но затем решил преобразовать их как часть ETL в GLUE.
Формат отметки времени: 1/08/2010 6:15:00 PM