Вопросы с тегом апач искра

0 голосов

0 ответов

Разница между запущенным искровым приложением в качестве автономного и искрового запуска / искровой пусковой установки?

Я изучаю различные варианты упаковки приложения Spark, и меня смущает, какой режим является лучшим...

Mozhi / 18 февраля 2019

0 голосов

0 ответов

Сумма векторных столбцов в искре

У меня есть фрейм данных, где у меня есть несколько столбцов, которые содержат векторы (число...

rasthiya / 14 февраля 2019

0 голосов

2 ответов

Загрузка Spark Config для тестирования Spark Applications

Я пытался протестировать приложение spark на моем локальном ноутбуке, прежде чем развертывать его в...

NicolasCage / 03 февраля 2019

0 голосов

2 ответов

Более быстрое время разработки с AWS Glue

AWS Glue выглядит многообещающе, но у меня есть проблема с временем цикла разработки.Если я...

wrschneider / 02 февраля 2019

0 голосов

1 ответ

При экспорте данных из Scala в CSV создается только папка

У меня есть spark 2.4.0, и у меня есть фрейм данных scala> dfExport.show(5)...

davidzxc574 / 01 февраля 2019

0 голосов

1 ответ

Итерации по СДР Итерируемые в Scala

Итак, я новичок в Scala и только начинаю работать с RDD и функциональными операциями Scala. Я...

EliSquared / 01 февраля 2019

0 голосов

4 ответов

Как разбить элементы списка на определенное количество столбцов в Spark Scala?

У меня есть список, содержащий случайное количество элементов Список Emp 101 [a, b, c, d, e] 102 [q...

rad / 30 января 2019

0 голосов

1 ответ

Хранение реляционных данных в hadoop для целей анализа

Я много читал о кластере hadoop и различных вариантах хранения наших реляционных данных в hadoop,...

Fatemeh Rouzbeh / 28 января 2019

0 голосов

0 ответов

Загрузить сценарий spark sql в работу AWS Glue

У меня много запросов Spark SQL к таблицам AWS Athena, сохраненным в виде текстовых файлов.Могу ли...

sabz / 25 января 2019

0 голосов

1 ответ

Разбор файла Json на S3 с использованием Json Play с использованием Scala

Я хочу получить доступ к файлу json из S3 с помощью json play fromework val...

user1393608 / 25 января 2019

0 голосов

1 ответ

Лучший способ транспонировать или поворачивать массив категориальных переменных для кодировки Spark ML

Я работаю над настройкой категориальных переменных для моделей с искровым ML. Вместо столбца с...

AshleyOboe / 25 января 2019

0 голосов

1 ответ

Интерактивный сеанс pyspark запущен непосредственно на ошибках кластера GCP dataproc о таблице по умолчанию HIVE

С помощью pyspark на GCP я иногда получаю сообщения типа AnalysisException: "Database...

MrCartoonology / 23 января 2019

0 голосов

0 ответов

Доступ к таблице HIVE с помощью файла pyspark .py

Я получаю данные из таблицы sql, используя этот код, когда я запускаю в терминале pyspark на...

Zmnako Awrahman / 23 января 2019

0 голосов

1 ответ

Apache Spark Scala с проверкой Play-JSON

java.lang.UnsupportedOperationException: Схема для типа [trait object] не поддерживается trait...

Rex / 23 января 2019

0 голосов

1 ответ

Spark MLlib: разница между DecisionTree.trainClassifier и DecisionTree.train

Я не вижу разницы между DecisionTree.trainClassifier и DecisionTree.train методами. В коде для...

mjbsgll / 21 января 2019

0 голосов

0 ответов

Специальный символ "$" не передается в качестве аргумента при отправке в Spark

Я пытаюсь передать пароль в качестве аргумента в команде отправки Spark. Как только этот пароль...

Matthias / 21 января 2019

0 голосов

1 ответ

Как я могу сохранить вывод журнала искры при запуске на моем локальном компьютере через intellij?

Я занимаюсь разработкой программного обеспечения на основе scala-spark, и мне нужно сначала...

D. RoDe / 21 января 2019

0 голосов

1 ответ

Задание Spark не работает, когда JAR находится в HDFS

Я пытаюсь запустить искровое задание в автономном режиме, но команда не получает файл JAR из HDFS....

Kumar Harsh / 19 января 2019

0 голосов

1 ответ

Переименовать ключ во вложенной схеме Spark DataFrame (Scala)

У меня есть сценарий использования, который должен прочитать вложенную схему JSON и записать ее...

Am1rr3zA / 18 января 2019

0 голосов

0 ответов

который является правильным уровнем многословия регистрации для CI в нескольких крупных проектах Scala Spark

Учитывая следующую ситуацию / настройку: команда разработчиков из 5-6 парней 5 взаимозависимых...

Yordan Georgiev / 18 января 2019

0 голосов

0 ответов

Может ли несколько подписчиков подписаться на один и тот же EventHub с группой потребителей $ default

У меня есть две работы Spark, которые в основном подписываются на один и тот же EventHub с группой...

rahul sharma / 14 января 2019

0 голосов

1 ответ

Проблема SparkWordCount - исключение java.lang.ClassNotFoundException

Это не повторяющийся вопрос, и я пробовал так много способов сделать эту работу, но не сработал Я...

Miguel A. Friginal / 14 января 2019

0 голосов

1 ответ

JSON аргумент в Spark представить

Моя команда spark-submit: spark-submit --deploy-mode cluster --class spark_package.import_jar...

Raghu kanala / 11 января 2019

0 голосов

2 ответов

Карта искр со множеством строк

Я ищу способ оптимизировать код, подобный этому: // for each line do many string concatenations...

Benjamin / 11 января 2019

0 голосов

0 ответов

Не в состоянии запустить спарк-подчинение после создания банки от Maven

Я создал банку, используя mavan и intellij, и попытался запустить банку. Я получаю следующую ошибку

BigD / 10 января 2019