Вопросы с тегом апаш-искра

0 голосов

2 ответов

Почему я получаю несоответствие типов в Scala Spark?

Сначала я читаю текстовый файл и превращаю его в RDD [(String, (String, Float))]: val data = sc

nick_liu / 21 мая 2018

0 голосов

0 ответов

Scala: создайте карту на основе UDF

Схема кадра данных df10 root |-- ID: string (nullable = true) |-- KEY: array (nullable = true) |...

Manasvee Kumar / 21 мая 2018

0 голосов

2 ответов

распознаватель sbt jackson для проекта spark использует базу данных maxmind

Я использую версию Spark Streaming 2.3.0, которая использует Jackson 2.6.7.Я использую библиотеку...

ajaypr55 / 21 мая 2018

0 голосов

0 ответов

График обнаружения цикла с помощью Spark (или любого параллельного алгоритма)?

У меня есть проблема, когда я должен принять большой поток данных, где каждый элемент - это человек...

gotch4 / 21 мая 2018

0 голосов

1 ответ

java.lang.RuntimeException: com.datastax.bdp.fs.model.NoSuchFileException: файл не найден: / tmp / hive /

У меня следующий код: def main(args: Array[String]) { val conf = new SparkConf()

Pinnacle / 21 мая 2018

0 голосов

1 ответ

Как создать фрейм данных для потоковой передачи кафки с помощью PySpark?

Я использую kafka версии 2.11-1.0.1 и Spark версии 2.0.2.Я должен сделать dataframe для ответа...

Rajendra Jangir / 21 мая 2018

0 голосов

1 ответ

Hive SaveAsTable создает новый файл таблицы Parquet для каждого запуска

У меня есть следующий код Scala, который я использую для записи данных из файла json в таблицу в...

Neha / 21 мая 2018

0 голосов

1 ответ

Apache Spark: не могу использовать Matplotlib на ноутбуке Jupyter

Я хотел сделать простую вещь. На моем искровом кластере я преобразовал свой массив данных Spark в...

david nadal / 21 мая 2018

0 голосов

1 ответ

Ошибка при добавлении схемы в Spark DataFrame, загруженную из файла

val tableDF = spark.read.option("delimiter",",")

kiran kumar / 21 мая 2018

0 голосов

1 ответ

Стратегия распределения разделов Apache Spark

В Apache Spark есть стратегии разделения.Хеш-разметка, Range-разметка и возможность записи...

Morozov Ivan / 20 мая 2018

0 голосов

1 ответ

Преобразование значения ключа rdd в просто rdd со списком значений

Как я могу преобразовать значение ключа rdd в rdd с помощью только списка значений в PySpark?...

Rvsvgs / 20 мая 2018

0 голосов

1 ответ

Spark: Как прочитать файл Avro или Parquet как набор данных

Учитывая, что файлы Avro и Parquet содержат и данные, и схему для этих данных, то в Spark должна...

user1888243 / 20 мая 2018

0 голосов

1 ответ

В Spark структурированные потоки, как вывести полные агрегаты во внешний источник, такой как REST-сервис

Задача, которую я пытаюсь выполнить, состоит в агрегировании подсчета значений из измерения (поля)...

Warren Roberts / 20 мая 2018

0 голосов

1 ответ

Spark: java.lang.IllegalArgumentException: требование не выполнено, kmeans (mllib)

Я пытаюсь выполнить кластеризацию с помощью kmeans.Мой набор данных: https://archive.ics.uci

Lucas Peñalver / 20 мая 2018

0 голосов

1 ответ

Как преобразовать XML-файлы с несколькими строками тегов в фрейм

У меня есть XML-файл с несколькими строками строк.Мне нужно преобразовать этот XML-файл для...

LUZO / 20 мая 2018

0 голосов

0 ответов

Spark (или pyspark) столбцы содержимого перемешиваются с GroupBy

Я работаю со Spark 2.2.0. У меня есть DataFrame, вмещающий более 20 столбцов.В приведенном ниже...

user63351 / 20 мая 2018

0 голосов

1 ответ

Spark2 не может найти таблицу или представление на удаленном кластере hdfs

Я использую HiveContext для удаленного запроса таблицы кустов в кластере hdfs через spark 1.6.0 и...

udit / 20 мая 2018

0 голосов

1 ответ

Получить первый элемент каждого элемента двумерного упакованного массива в кадре искры

Я получаю один фрейм данных методом https://spark.apache.org/docs/2.3.0/api/scala/index.html#org

Skateboard / 20 мая 2018

0 голосов

1 ответ

Путь к файлу ошибок чтения Spark не существует

Привет всем, При чтении данных из файла в искре я получаю сообщение об ошибке, как будто путь не...

Sunitha / 20 мая 2018

0 голосов

1 ответ

Udf не работает

Можете ли вы помочь мне оптимизировать этот код и заставить его работать?это исходные данные:...

bboy / 20 мая 2018

0 голосов

1 ответ

Должен ли я сохранять фрейм данных Spark, если я продолжаю добавлять в него столбцы?

Я не смог найти ни одной дискуссии по теме ниже ни на одном форуме, который искал в интернете.Это...

Jaygovind Sahu / 20 мая 2018

0 голосов

1 ответ

Spark Физический план и логический план

У меня есть два вопроса: Без добавления какого-либо дополнительного кода для печати логического и...

arg / 20 мая 2018

0 голосов

0 ответов

spark-shell не может автозаполниться при запуске в докере с --user

Я запускаю спарк-оболочку с докером.Автозаполнение spark-shell работает нормально, когда я запускаю...

coolcropper / 19 мая 2018

0 голосов

1 ответ

Запуск Spark Job на Zeppelin

Я написал собственную библиотеку искр в Scala.Я могу выполнить это успешно, как шаг spark-submit,...

Dark Shadows / 19 мая 2018

0 голосов

0 ответов

Как реализовать собственный приемник в режиме добавления и обновления в Apache Spark 2.3?

Как реализовать собственный приемник в режиме добавления и обновления в Apache Spark 2.3? Я понимаю...

user1870400 / 19 мая 2018