Вопросы с тегом апаш-искра - PullRequest

Вопросы с тегом апаш-искра

0 голосов
0 ответов

Я пытаюсь установить размер блока и размер группы строк для моего экземпляра hdfs для тестирования

user3685285 / 13 ноября 2018
0 голосов
0 ответов

Извлечено из документации о совместной фильтрации в Spark с использованием ALS: По умолчанию Spark...

Rushdi Shams / 13 ноября 2018
0 голосов
2 ответов

Я работаю с моделью ALS Apache Spark, а метод рекомендуемаяForAllUsers возвращает фрейм данных со...

Miguel A. Friginal / 13 ноября 2018
0 голосов
0 ответов

Я выполняю SQL-запрос Spark для нескольких столбцов информационного кадра с 200 разделами. Это...

Cuurie / 13 ноября 2018
0 голосов
3 ответов

Допустим, у меня есть искровой фрейм данных, который включает в себя категориальные столбцы (школа,...

John Subas / 13 ноября 2018
0 голосов
1 ответ

У меня есть файл Geojson, и я хочу извлечь схему (structtype), соответствующую с помощью spark....

Mak / 13 ноября 2018
0 голосов
1 ответ

Я написал кастом SQLTransformer в PySpark.И установка оператора SQL по умолчанию обязательна для...

Bentech / 13 ноября 2018
0 голосов
0 ответов

Я работаю над объединением двух больших наборов данных с количеством строк 17M и 2,2M. Размер...

Akul Narang / 13 ноября 2018
0 голосов
0 ответов

Существует одно требование для реализации побитовой операции ИЛИ в одном столбце на основе группы с...

SrinivasaRao G / 13 ноября 2018
0 голосов
0 ответов

Я пишу UDT для LocaleDateTime, который спарк SQL не поддерживает изначально class LocalDateTimeUDT...

Tom / 13 ноября 2018
0 голосов
1 ответ

У нас есть основанная на событиях инфраструктура, в которой мы используем потоковую передачу Kafka...

RajData / 13 ноября 2018
0 голосов
3 ответов

У меня есть пример файла, который я пытаюсь выяснить для данного поля общее число другого поля и...

Karthik Ramachandran / 13 ноября 2018
0 голосов
0 ответов

Я выполняю свою искровую работу в кластере Emr, и я использую Hive Tables в качестве источника...

Sundeep Pidugu / 13 ноября 2018
0 голосов
2 ответов

Попытка загрузить CSV-файл без вывода схемы. Обычно мы создаем схему как StructType в коде искры....

Lucky / 13 ноября 2018
0 голосов
0 ответов

У меня блестящая работа. Когда он начинает запись в Kafka, его пул обработчиков запросов настолько...

guru107 / 13 ноября 2018
0 голосов
2 ответов

получая это предупреждение ниже при попытке создать временную таблицу, помогите решить это...

palanivel / 13 ноября 2018
0 голосов
1 ответ

Итак, я использую элементы управления, такие как z.input, для ввода пользовательских данных в...

AlexScalar / 13 ноября 2018
0 голосов
1 ответ

У меня есть 2 вопроса относительно spark и хранилища данных Snowflake. 1) Есть ли способ запросить...

Ram Ghadiyaram / 12 ноября 2018
0 голосов
0 ответов

Я знаю, что мы можем запустить spark-shell с ошибкой в ​​журналах, но есть ли объяснение этим...

RobbieTheK / 12 ноября 2018
0 голосов
1 ответ

У меня проблема с модулем Spark GraphX. У меня кластер из 5 узлов, с 23,5 ГБ памяти и 24 ядрами на...

Sedir Mohammed / 12 ноября 2018
0 голосов
1 ответ

Я пытаюсь вычислить среднеквадратическую ошибку (RMSE) вручную на Spark (Scala 2.11) Как показано...

Haha TTpro / 12 ноября 2018
0 голосов
0 ответов

Я новичок в использовании spark и пытаюсь вычислить огромные данные и отправить их в целевую базу...

Prorsum J / 12 ноября 2018
0 голосов
1 ответ

У меня S3 bucket с двумя форматами разделов: S3: // bucketname / имя_таблицы / год / месяц / день...

John Hass / 12 ноября 2018
0 голосов
0 ответов

Я прочитал исходный код спарк главной ветки (2018/11), который будет опубликован в версии спарк 2.5

yeshang / 12 ноября 2018
0 голосов
0 ответов

У меня есть фрейм данных, который я пытаюсь записать в папку S3 в виде JSON. df.printSchema root...

dreddy / 12 ноября 2018
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...