Можно ли создать классификатор Грока для файлов паркета?Если да, где я могу найти примеры?
Я использую AWS Glue Catalog и пытаюсь создать внешние таблицы поверх файлов Parquet.Я бы хотел, чтобы классификатор разделял файлы в соответствии с одним из столбцов файлов.
Все мои файлы имеют столбец "таблица", а все записи в файле имеют одну и ту же таблицу.
Моя структура S3 выглядит так
- s3://my-bucket/my-prefix/table1/...
- s3://my-bucket/my-prefix/table2/...