Вопросы с тегом апаш-искра - PullRequest

Вопросы с тегом апаш-искра

0 голосов
1 ответ
0 голосов
1 ответ

Контекст Я хочу использовать Spark 2 для некоторых элементарных ETL, но наши администраторы Hadoop...

Leo Orientis / 25 апреля 2019
0 голосов
0 ответов

У меня есть проект maven spark java, который я хочу запустить на своем локальном компьютере, но...

user1495744 / 25 апреля 2019
0 голосов
1 ответ

Я следую вместе с кодом в Apache Spark Definitive Guide.Я столкнулся с проблемой, когда следующий...

Keerikkattu Chellappan / 25 апреля 2019
2 голосов
1 ответ

Spark v2.4 no Hive Преимущество Spark от bucketBy в том смысле, что он знает, что DataFrame имеет...

colinfang / 25 апреля 2019
0 голосов
0 ответов

Я хочу установить имя пользователя и пароль на hiveserver2 в AWS EMR. Я хочу установить «Spark SQL»...

tuitto / 25 апреля 2019
0 голосов
0 ответов

Я на ноутбуке jupyter и хочу смоделировать сервер для отправки виртуальных данных в приложении...

Romain Jouin / 25 апреля 2019
0 голосов
0 ответов

Я пытаюсь позвонить map на PairRDD.Spark дает мне эту подпись: map[U](f: (A,B) => U) Я ожидал...

Atte Juvonen / 24 апреля 2019
0 голосов
0 ответов

Из того, что я вижу, rdd.toDF() вводит PythonRDD, что становится ExistingRDD в плане запроса. df1 =...

colinfang / 24 апреля 2019
0 голосов
0 ответов

Попытка просто взять некоторые файлы из корневого каталога моего проекта (того же уровня, что и...

horatio1701d / 24 апреля 2019
0 голосов
0 ответов

Выполнение одного и того же запроса в Impala Hue и Spark с разными значениями. Я пытаюсь получить...

amit kumar / 24 апреля 2019
0 голосов
1 ответ

Я новичок в Spark. Я могу суммировать, вычитать или умножать массивы в Python Pandas & Numpy. Но...

Silvana / 24 апреля 2019
1 голос
1 ответ

я работаю на спарке 1.6.1 У меня есть распределенный фрейм данных, и он наверняка больше, чем все...

user1361815 / 24 апреля 2019
2 голосов
1 ответ

У меня есть служебная функция, написанная на scala для чтения паркетных файлов из корзины s3. Может...

wandermonk / 24 апреля 2019
0 голосов
0 ответов
0 голосов
1 ответ

Я столкнулся со странным поведением Apache Spark. Проблема в том, что я получаю неправильное...

ruslangm / 24 апреля 2019
0 голосов
1 ответ

Я настраиваю приложение, в котором я использую сеанс spark для чтения данных с Кассандры. Я могу...

Shreya Mahajan / 24 апреля 2019
0 голосов
0 ответов

Spark Structured Streaming записал результаты в kafka, но я не смог найти данные в теме Kafka,...

nsko / 24 апреля 2019
0 голосов
1 ответ

Я пытаюсь собрать набор данных в формате JSON val df = spark.sql("select invn_ctl_nbr,cl_id...

Mohit Raja / 24 апреля 2019
0 голосов
0 ответов

Я использовал Bucketing при объединении двух таблиц, но обмен все еще происходит. Я не уверен, что...

RIYA SINGHAL / 24 апреля 2019
1 голос
1 ответ

Когда задание Spark не может получить достаточно ресурсов для запуска, и оно зависает там, чтобы...

Will Wang / 24 апреля 2019
1 голос
1 ответ
0 голосов
2 ответов

В моем приложении структурированного потокового вещания я читаю сообщения от Кафки, фильтрую их и,...

raizsh / 24 апреля 2019
1 голос
0 ответов

Используя следующий код в заметке Zepplin, я смог добавить репозиторий и зависимость. Как бы я...

Ari / 24 апреля 2019
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...