Сбой AWS Glue Crawler с 11 миллионами файлов на S3 - PullRequest
0 голосов
/ 10 июня 2018

Получил 11 миллионов + json файлов в S3.

Попытался сканировать и каталогизировать их в AWS Glue.

JSON Подробности файла:

КаждыйРазмер файла от 250 КБ до 2 МБ без сжатия.

Журналы:

BENCHMARK : Running Start Crawl for Crawler impall
ERROR : Internal Service Exception
BENCHMARK : Crawler has finished running and is in state READY

Я пропустил какой-либо шаг в обработке этих огромных файлов?

...