Вопросы с тегом апаша-искра - PullRequest

Вопросы с тегом апаша-искра

0 голосов
0 ответов

Обратите внимание на мое специальное требование о передаче значения из задания Child Spark в...

TomG / 16 сентября 2018
0 голосов
2 ответов

Я хочу преобразовать строку в столбец с помощью искрового фрейма данных. Моя таблица выглядит так:...

Arush70 / 15 сентября 2018
0 голосов
3 ответов

Следующий код возвращает 16 разделов.Как это возможно иметь 16 разделов для массива 1 вещь? rdd =...

fatdragon / 15 сентября 2018
0 голосов
1 ответ

Есть ли надежный способ предсказать, какие операции с кадрами данных Spark сохранят разбиение, а...

Go Erlangen / 15 сентября 2018
0 голосов
1 ответ

из Spark RDD, я хочу подготовить и заархивировать данные JSON в AWS S3. Имеет смысл только сжать...

kmh / 15 сентября 2018
0 голосов
1 ответ

Я отчаянно пытаюсь изменить часовой пояс моей JVM в Sparklyr (используя spark 2.1.0). Я хочу GMT...

ℕʘʘḆḽḘ / 14 сентября 2018
0 голосов
1 ответ

Мне нужно написать временную метку в паркет, а затем прочитать ее с помощью Hive и Impala. Чтобы...

Rolintocour / 14 сентября 2018
0 голосов
1 ответ

У меня есть запрос, касающийся некоторых изменений моего запроса Hive в соответствии с требованием,...

knowone / 14 сентября 2018
0 голосов
2 ответов

Я пытаюсь разделить сеансы из набора данных lastfm, следуя ответу от https://www.arundhaj

user2635060 / 14 сентября 2018
0 голосов
1 ответ

Я не фанат HDFS, но, исходя из традиционного опыта работы с RDMS, я начинаю царапать новые...

Lost / 13 сентября 2018
0 голосов
1 ответ

Я новичок в Spark и Scala, поэтому понятия не имею, как называется проблема такого типа (что делает...

Jesse / 13 сентября 2018
0 голосов
0 ответов

У меня есть приложение, которое читает несколько файлов данных из вложенных структур каталогов:...

user2896120 / 13 сентября 2018
0 голосов
1 ответ

У меня есть Rdd[(Int, (val1, val2))], который я хочу отсортировать по val2, но единственный...

Tmpoul / 13 сентября 2018
0 голосов
1 ответ

Я пытаюсь найти все отдельные значения в каждом столбце в кадре данных и показать в одной таблице....

LEJ / 13 сентября 2018
0 голосов
0 ответов

Мне известно о spark.sparkContext.statusTracker но я могу иметь доступ только к номеру Executors и...

Wonay / 13 сентября 2018
0 голосов
3 ответов

У меня есть Rdd[(Int, Double)] и array[Int], и я хочу получить новый Rdd[(Int, Double)] только с...

Tmpoul / 13 сентября 2018
0 голосов
0 ответов

Я хотел бы сделать матрицу подобия больших данных для спектральной кластеризации.Для этого я...

Naghmeh / 13 сентября 2018
0 голосов
0 ответов

Я изучаю PySpark, и в моей школе настроен JupyterHub с Spark.Когда я пытаюсь запустить следующую...

Novice / 13 сентября 2018
0 голосов
0 ответов

Я сейчас использую sparklyr.Я могу подключиться к нашему кластеру, но по умолчанию используется...

RLW / 13 сентября 2018
0 голосов
0 ответов

Дело в том, что у меня есть два одинаковых выхода, один текстовый (CTR + A разделенный), а второй...

Hrabě / 13 сентября 2018
0 голосов
1 ответ

Сколько соединений будет создано между spark и hdfs при вызове sc.textFile ("hdfs: // .....").Файл...

Calix / 13 сентября 2018
0 голосов
2 ответов
0 голосов
2 ответов

Я пытаюсь подписаться на тему в kafka, используя оболочку scala, и ниже приведена команда, которую...

Aish Mahesh / 12 сентября 2018
0 голосов
1 ответ

Я хочу сохранить / записать / выгрузить фрейм данных spark из блоков данных в папку хранилища...

Geet / 12 сентября 2018
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...