Я пришел к вам, чтобы узнать, есть ли у вас профессиональные советы для загрузки последних CSV-файлов, сгенерированных заданием Glue, в корзину S3 для загрузки в блокнот Jupyter.
Я использую эту команду для загрузки своихCSV из папки S3. Можно ли выбрать только файлы с последними измененными CSV-файлами?
df = sqlContext.read.csv(
's3://path',
header=True, sep=","
)
До того, как у меня появилась тенденция преобразовывать динамический фрейм данных в классический фрейм данных, чтобы перезаписать старые файлы, сгенерированные моим заданием Glue.
Это невозможно, генерируя DyF
Спасибо