Вопросы с тегом апаша-искра - PullRequest

Вопросы с тегом апаша-искра

0 голосов
0 ответов

Используя IntelliJIdea и Maven, я пытаюсь взять таблицу csv и преобразовать ее в таблицу Hive (или...

Foxlooo / 29 мая 2018
0 голосов
1 ответ

Я запускаю искровое задание в режиме перезаписи.Я ожидал, что он удалит данные в таблице и вставит...

Sumit Chauhan / 29 мая 2018
0 голосов
1 ответ

У меня есть фрейм данных со следующими столбцами и соответствующими значениями (простите мое...

didierforever / 29 мая 2018
0 голосов
1 ответ

Я хочу преобразовать приведенный ниже RDD в пары значений ключа, причем каждый ключ имеет два...

Arjun / 29 мая 2018
0 голосов
0 ответов

Я использую Pyspark для вычисления PMI (Point Mutual Infomation).И я нашел код Scala в Вычисление...

Hsiaohsin / 29 мая 2018
0 голосов
1 ответ

У меня есть CSV-файл с разными длинами в строке, например: left, 10, xdfe, 8992, 0.231 left, 10,...

Ivan / 28 мая 2018
0 голосов
1 ответ

Как я могу загрузить кучу файлов из корзины S3 в один фрейм данных PySpark?Я работаю на экземпляре...

Paul Bendevis / 28 мая 2018
0 голосов
1 ответ

В Apache Spark я знаю, что когда я использую некоторые функции преобразования, все функции...

shubham / 28 мая 2018
0 голосов
1 ответ

Я создал ключ-значение RDD, но я не уверен, как выбрать из него значения. val mapdf =...

Arjun / 28 мая 2018
0 голосов
2 ответов

У нас мало искровых пакетных заданий и потоковых заданий.Пакетные задания Spark выполняются в...

Ravi Lohan / 28 мая 2018
0 голосов
1 ответ

У меня есть dataframe - преобразованные dtypes в карту. val dfTypesMap:Map[String,String]] = df

Chandra / 28 мая 2018
0 голосов
1 ответ

У меня есть List [String] и я добавляю значение этих строк в качестве имен столбцов в существующий...

user9733169 / 28 мая 2018
0 голосов
1 ответ

Можно ли выполнить собственную логику при группировке набора данных Spark?Вот пример простой печати...

Turo / 27 мая 2018
0 голосов
2 ответов

// package com.jsonReader import play.api.libs.json._ import play.api.libs.json._ import play.api

Ashwini Kumar / 27 мая 2018
0 голосов
0 ответов

Я хочу сохранить данные в MongoDB при потоковой передаче из Twitter.Каждый RDD в DStream содержит...

Cassie / 27 мая 2018
0 голосов
2 ответов

Предположим, что замыкание было выполнено в JVM и создает объект в области действия этого замыкания

mychaint / 27 мая 2018
0 голосов
2 ответов

Я отправляю свое искровое задание с помощью сценария оболочки и хочу знать, успешно ли выполнено...

Manoj Kumar Dhakd / 26 мая 2018
0 голосов
1 ответ

Я пытаюсь запустить пример pi.py с использованием spark-submit, но я получаю следующую ошибку,...

nullptr / 26 мая 2018
0 голосов
1 ответ

Как запустить программный автономный мастер Spark в Scala? В связи с этим документом: https://spark

Joan / 25 мая 2018
0 голосов
1 ответ

У меня есть программа Spark, в которой каждый узел-исполнитель обрабатывает некоторые части моего...

Hoori M. / 25 мая 2018
0 голосов
0 ответов

Я попытался использовать примеры документации соединителя MongoDB-Spark, однако они не работают.В...

Cassie / 25 мая 2018
0 голосов
2 ответов

У меня есть проект с несколькими привязками SLF4J.Я прочитал и попробовал решения в этом SO...

mkunkel / 25 мая 2018
0 голосов
1 ответ

Итак, я выяснил, как найти последний файл, используя python.Теперь мне интересно, смогу ли я найти...

Eles / 25 мая 2018
0 голосов
1 ответ

Я использую spark (с pyspark) в кластерном режиме и читаю данные из RDBMS через JDBC.Я читаю...

Olivier WARNIER Ste WHYME / 25 мая 2018
0 голосов
3 ответов

Используя PySpark в ноутбуке Jupyter, вывод Spark DataFrame.show не требует больших технологий по...

clstaudt / 25 мая 2018
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...