Могут ли возникнуть проблемы с чтением искрового фрейма данных и, скажем, сохранение его через блокнот Jupyter и другой процесс, выполняющий одновременную запись в корзину s3?
Скажем,
Я читаю фрейм данных как:
s3 = spark.read.parquet('s3://path/to/table')
И поработайте над этим в записной книжке.
Одновременно я записываю в одно и то же ведро s3 в какой-то момент другим способом, например
system('s3-dist-cp --src --dest s3://path/to/table)
Это когда-нибудь окажется проблемой?Я в порядке, когда испортил чтение / фрейм данных, но я не хотел бы блокировать запись в корзину.