Вопросы с тегом апаша-искра - PullRequest

Вопросы с тегом апаша-искра

0 голосов
1 ответ

У меня есть фрейм данных: yearDF со следующими столбцами: name, id_number, location,...

Metadata / 24 сентября 2018
0 голосов
1 ответ

У меня есть кластер искр и воздушных потоков, который построен с помощью док-роя.Контейнер...

ugur / 24 сентября 2018
0 голосов
0 ответов

Я пытаюсь установить пакет SparkR в R в версии Cloudera 5.14.Я установил JAVA_HOME и SPARK_HOME...

Akash Bhattacharyya / 24 сентября 2018
0 голосов
0 ответов

Я запускаю программу spark в scala и получаю ошибку ниже времени выполнения: Exception in thread...

Kumar Harsh / 24 сентября 2018
0 голосов
1 ответ

Я пытаюсь определить схему для файла CSV, используя case class в Scala. case class userSchema(name...

Kumar Harsh / 24 сентября 2018
0 голосов
1 ответ

Когда я читаю код Python других людей, например, spark.read.option("mergeSchema",...

Tim.X / 24 сентября 2018
0 голосов
1 ответ

Я присоединился к двум фреймам данных и сейчас пытаюсь получить отчет, состоящий из столбцов из...

Ravi / 24 сентября 2018
0 голосов
1 ответ

Как зажигать данные из HDFS в кластере? Как блоки преобразуются в RDD? Допустим, у меня есть...

kmb s / 23 сентября 2018
0 голосов
1 ответ

Мой скалярный код Spark выглядит так: val input = sc.newAPIHadoopRDD(jconf, classOf[CqlInputFormat]...

Jenny.D / 23 сентября 2018
0 голосов
1 ответ

Я использую spark-cassandra-connector_2.11-2.0.0.jar для подключения к Cassandra (версия 2.1.9)

Jenny.D / 23 сентября 2018
0 голосов
2 ответов

Я хочу выбрать несколько столбцов из DF. Между столбцами мне нужно добавить разные пробелы, так как...

Katty / 22 сентября 2018
0 голосов
1 ответ

Попытка построить образ из предоставленной загрузки.Используется опция загрузки пакета «Исходный...

Jon Boy / 22 сентября 2018
0 голосов
1 ответ

Я пытаюсь запустить искровой код, который будет читать таблицу в базе данных postgres и вставлять...

Metadata / 21 сентября 2018
0 голосов
1 ответ

Используя PySpark, я хочу получить максимальное значение среди всех ключей пары RDD.Данные базового...

Soheil Pourbafrani / 21 сентября 2018
0 голосов
0 ответов

Я пытаюсь запустить кластер H2O автоматически во внешнем бэкэнде, как описано в этой документации ....

ngi / 21 сентября 2018
0 голосов
1 ответ

Мы создаем приложение на основе Spark, используя Spark 2.3.0.Наши рабочие места Spark...

Anuj Mehra / 21 сентября 2018
0 голосов
2 ответов

Я изучаю Spark и начинаю понимать, как Spark распределяет данные и объединяет результаты.Я пришел к...

Sorin-Alexandru Cristescu / 21 сентября 2018
0 голосов
1 ответ

Я работаю с данными с отметками времени, которые содержат наносекунды, и пытаюсь преобразовать...

Himanshu Gupta / 21 сентября 2018
0 голосов
2 ответов

Есть ли быстрый и эффективный способ разворачивать данные?Я использовал следующие методы, и хотя...

RonD / 21 сентября 2018
0 голосов
1 ответ

Образец DF: var someDF = Seq( (1, "2017-12-02 03:04:00"), (1, "2017-12-02...

vikky / 21 сентября 2018
0 голосов
0 ответов

У меня есть два фрейма данных, которые я объединяю с помощью объединения.После выполнения...

john / 21 сентября 2018
0 голосов
0 ответов

Я использую Spark для подключения к Кассандре.Входные разбиения: Input split:...

Jenny.D / 20 сентября 2018
0 голосов
1 ответ

У меня есть требование, при котором я должен читать файлы паркета в разных каталогах в HDFS

AHS / 20 сентября 2018
0 голосов
0 ответов

org.apache.spark.SparkException: задание прервано из-за сбоя этапа: задание 0 на этапе 0.0 не...

Keerthi / 20 сентября 2018
0 голосов
1 ответ

У меня есть две большие таблицы, разбитые по столбцу даты.Они сохраняются в виде паркетных файлов в...

eakotelnikov / 20 сентября 2018
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...