У меня есть корзина в S3, которая содержит файлы на основе шаблона <date>_<city>_<other>.csv
, например:
20190302_newyork_flights.csv
20190302_newyork_cabs.csv
20190304_london_cabs.csv
20190304_glasgow_cabs.csv
20190201_miami_flights.csv
etc
Я хотел бы включить в таблицу Glue / CatalogDb только файлы для городов newyork
и london
независимо от других фрагментов текста. Для этого я прочитал документацию для "разбора глобуса" здесь: https://docs.aws.amazon.com/glue/latest/dg/define-crawler.html#crawler -data-stores-exclude и на основании этого я написал выражение в параметре exclusions
json как:
Type: AWS::Glue::Table
Properties:
DatabaseName: MyDb
TableInput:
Name: MyTable
TableType: EXTERNAL_TABLE
Parameters: {
"skip.header.line.count" : "1",
other params...
"exclusions" : "[\"mybucket*!{newyork,london}*.csv\"]"
}
....
Однако это не работает. Есть идеи, как это исправить?