Вопросы с тегом апаш-искра - PullRequest

Вопросы с тегом апаш-искра

0 голосов
1 ответ
0 голосов
0 ответов

Я отправляю задание зажигания в Livy с помощью лямбда-функции AWS.Задание выполняется до конца...

Kieran Taylor / 09 апреля 2019
0 голосов
1 ответ

Я пытаюсь прочитать файлы из нескольких блоков s3. Первоначально ведра были бы в разных регионах,...

User24061990 / 09 апреля 2019
0 голосов
0 ответов
0 голосов
0 ответов

Я использую Spark Streaming.У меня есть два потока: value-stream и user-thresholds stream.Каждые...

VB_ / 09 апреля 2019
1 голос
1 ответ

Я пытаюсь запустить задание python на искровом кластере EMR. В параметрах отправки свечей я...

Zhang YaoWen / 09 апреля 2019
0 голосов
0 ответов

Я попытался включить мониторинг с использованием асинхронного API, приведенного в документации -...

gashu / 09 апреля 2019
3 голосов
2 ответов

Мне нужно добавить несколько столбцов в существующий фрейм данных искры, где имена столбцов...

nat / 09 апреля 2019
0 голосов
2 ответов

Я хочу добавить условный столбец Flag к кадру данных A. Если выполнены следующие два условия,...

Neel_sama / 08 апреля 2019
0 голосов
0 ответов

В масштабе мое приложение Spark будет работать с большим объемом данных (много ТБ).Многие из моих...

B. Smith / 08 апреля 2019
0 голосов
1 ответ

Мое искровое приложение состоит из начального RDD, на котором я выполняю 10 преобразований. DAG для...

B. Smith / 08 апреля 2019
0 голосов
0 ответов

У меня есть файл в aws S3, в форматах CSV (~ 20 ГБ) и паркета (~ 4 ГБ). Этот файл проходит два...

Jesu Benin / 08 апреля 2019
0 голосов
2 ответов

день изменения pyspark в столбце datetime Я пытаюсь сделать что-то похожее на ответ выше.Я получаю...

Brian / 08 апреля 2019
2 голосов
0 ответов

Допустим, у меня есть этот фрейм данных +--------+-------+-----+-------+--------------------------+...

ricardohuarte / 08 апреля 2019
0 голосов
0 ответов

Я использую Hue4 для Hive и хотел бы запустить несколько операторов Select одновременно, аналогично...

Kenny / 08 апреля 2019
0 голосов
0 ответов

Я пытаюсь прочитать все файлы из двух разных сегментов s3, которые находятся в разных регионах. При...

User24061990 / 08 апреля 2019
1 голос
1 ответ

Я пытаюсь сделать много объединений для некоторых фреймов данных, используя spark в scala.Когда я...

pkgajulapalli / 08 апреля 2019
1 голос
1 ответ

Я использую алгоритм kmeans, я создаю VectorAssembler, устанавливаю inputcols в ("долгота",...

Aymen Rahal / 08 апреля 2019
1 голос
1 ответ

Coalesce логика работает нормально на CSV e1.csv id,code,type 1,,A 2,, 3,123,I e2.csv id,code,type...

Ratheri2 / 08 апреля 2019
0 голосов
0 ответов

У меня есть задача прочитать каждое сообщение в теме Кафки, которая имеет 3 раздела.У меня есть...

Aidai Beishekeeva / 08 апреля 2019
0 голосов
0 ответов

Я выполняю один и тот же искровой код, используя Spark SQL API и DataFrame API.Однако Spark SQL...

neeraj bhadani / 08 апреля 2019
0 голосов
1 ответ

Я новичок в Spark и пытаюсь выяснить, как работает динамическое распределение ресурсов. У меня есть...

dexter007 / 08 апреля 2019
0 голосов
1 ответ

Я пытаюсь использовать pyspark для майнинга правил ассоциации.Допустим, мои данные имеют вид:...

Feng Chen / 08 апреля 2019
4 голосов
2 ответов

Рассмотрим данные, записанные из dataframe в kafka и затем прочитанные из kafka обратно в новый...

javadba / 08 апреля 2019
1 голос
0 ответов

Проблема Я хотел бы эффективно умножить 2 разреженных матрицы в инфраструктуре Spark в...

barak david / 07 апреля 2019
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...