Когда я отправляю задание на машине с набором машин, расположенной в лондонском часовом поясе,...
Я работаю с zeppelin в hdp 2.6. Я хочу прочитать коллекцию из mongodb, используя интерпретатор...
Я хочу ввести данные телеметрии, и на выходе получается многослойный вложенный файл JSON. Меня...
Я очень новичок в Spark и не могу найти способ сохранить измененный документ в базе данных: import...
Скажем, я хочу прочитать данные из внешней базы данных HDFS, и у меня есть 3 рабочих в моем...
Я использую структурированную потоковую передачу с использованием Kafka, однако при попытке...
Я пытаюсь создать производителя Kafka, связанного с потребителем Spark. Производитель работает...
Я новичок в Spark, и я хотел бы прочитать CSV-файл на Dataframe. Spark 1.3.0 / Scala 2.3.0 Это то,...
При запуске spark-shell я получаю следующую ошибку. Setting default log level to "WARN"....
Нужна помощь в сортировке по ключу после вывода groupByKey: val skuRDD2:RDD[(String...
Постановка задачи: У меня есть две таблицы - Данные (40 столбцов) и LookUp (2 столбца). Мне нужно...
Я пытаюсь написать приложение Spark, которое подключается к CosmosDB, используя...
Как вы можете видеть, мое небольшое приложение имеет 4 задания, которые выполняются общей...
Я пытаюсь следовать этому руководству на этом сайте: https://beta.rstudioconnect
Я хотел проанализировать sql запросы, выполненные пользователями из spark.Я проверил журналы...
Можно ли добавить новый столбец в существующую таблицу искр с помощью команды ALTER TABLE? var...
Попытка понять, как разделы Hive связаны с разделами Spark, завершается вопросом о соединениях. У...
Я пытаюсь использовать функцию createSataframe для sparksession, и я продолжаю получать сообщение...
У меня есть данные в Кассандре (3.11.2), которые также являются моими df: Данные в Кассандре: id |...
У меня есть фрейм данных df +----------+----+----+----+---+---+----+---+---+-------+-------+ |...
Я пытаюсь изменить мой JavaRDD из String на JavaRDD из Row.На шаге я меняю строку на строку
У меня есть некоторые проблемы при запуске потокового воспроизведения в моем кластере. Во-первых, я...
Получение неправильного результата на счету. +--------+ |count(1)| +--------+ | 0| // Should not be...
Я пытаюсь прочитать CSV-файл в кадре данных, используя кодировщик, но сталкиваюсь с некоторыми...
Я установил для spark.authenticate.enableSaslEncryption значение true и хочу убедиться, что RPC...