Прежде чем назвать этот дубликат, пожалуйста, прочитайте мой вопрос. Я нашел два метода проверки,...
Я использую Apache Spark и Redshift в VPC, а также использую AWS S3 для исходных данных и временных...
Моё искровое задание (EMR), которое пишет в s3 каждые 5 минут, не может писать несколько раз каждый...
Согласно документации Amazon, я могу получить конкретную версию объекта через REST URL и указать...
У меня есть экземпляр, который должен считывать данные из двух разных учетных записей s3. Корзина в...
Когда я использую spark локально, записывая данные в мою локальную файловую систему, он создает...
Я пытаюсь выгрузить данные красного смещения и прочитать их, используя искру.Но я получаю больше...
Недавно мы начали хранить наши резервные копии в aws s3. Это все CSV-файлы, которые нам нужно...
Я пытаюсь загрузить данные из Amazon Redshift в HDFS. val df = spark.read.format("com
У меня есть искровое задание, которое я полностью сократил до: spark.read