Вопросы с тегом апаш-искра - PullRequest

Вопросы с тегом апаш-искра

1 голос
1 ответ

Добавьте новый столбец с именем Download_Type к кадру данных с условиями: Если размер 100 000 и...

Iman / 28 июня 2019
0 голосов
2 ответов

Могу ли я создать Spark RDD (не PairRDD) с пользовательским Partitioner? Кажется, я не нашел в API...

fedmest / 28 июня 2019
0 голосов
0 ответов

У меня есть вопрос.Я пытаюсь сериализовать модель PySpark ML, чтобы mleap.Тем не менее, модель...

femibyte / 28 июня 2019
1 голос
2 ответов

Что такое соглашение об именах для Spark Application, определяемое как: SparkSession .builder

Morozov Ivan / 28 июня 2019
0 голосов
1 ответ

В настоящее время я изучаю возможность дисбаланса рабочей нагрузки в моих кластерах Apache Spark....

IllSc / 28 июня 2019
3 голосов
6 ответов

У меня есть фрейм данных с N полями, как указано ниже.Количество столбцов и длина значения будут...

user2427413 / 28 июня 2019
0 голосов
2 ответов

У меня есть сомнения по поводу spark-submit, для которых у меня нет четкого решения. Я уверен, что...

A B / 28 июня 2019
0 голосов
0 ответов

У меня есть набор данных класса случая события, который я хотел бы сохранить в нем строковый...

User24061990 / 28 июня 2019
1 голос
1 ответ

Я хочу подключиться к серверу Presto, используя JDBC в PySpark. Я следовал учебнику , написанному...

Aviral Srivastava / 28 июня 2019
0 голосов
0 ответов

При разделении большого набора данных (279 994 258 строк) на 2 части с помощью randomSplit я...

datapug / 28 июня 2019
1 голос
2 ответов

Итак, у меня есть данные со значениями, которые нужно сложить вместе, а затем поместить в формат...

ChiMo / 28 июня 2019
0 голосов
0 ответов

У нас есть службы REST, работающие на http-сервере, и мы хотели бы одновременно передавать...

Mata / 28 июня 2019
0 голосов
0 ответов

Успешно работает с кустом при искре на клиенте пряжи, но когда я меняю режим развертывания с...

Aifee / 28 июня 2019
0 голосов
1 ответ

Я имею в виду этот вопрос: Приведение кратных столбцов в кадре данных У меня есть кадр данных со...

mommomonthewind / 28 июня 2019
1 голос
0 ответов

Я использую следующий код в Spark для загрузки указанных столбцов моей таблицы HBase / Phoenix в...

Christopher Ferris / 28 июня 2019
2 голосов
1 ответ

Есть ли способ, кроме перераспределения (который замедляет обработку), объединить все файлы...

manohar g / 27 июня 2019
0 голосов
1 ответ

Мое намерение состоит в том, чтобы написать функцию python, которая бы принимала DataFrame pyspark...

Riyan Mohammed / 27 июня 2019
1 голос
1 ответ

Я читал книгу «Руководство по определению искр». У нее есть пример, подобный приведенному ниже. val...

liam xu / 27 июня 2019
0 голосов
1 ответ

У меня есть входящие потоковые данные, которые я сохраняю как таблицу deltalake, используя...

Pankaj Mishra / 27 июня 2019
0 голосов
0 ответов

Я слежу за документацией для обучения регрессора дерева решений или моих данных (https://spark

fricadelle / 27 июня 2019
0 голосов
2 ответов

У меня есть куча данных с 20000 строками в JavaRDD. Теперь я хочу сохранить несколько файлов с...

s1nned / 27 июня 2019
0 голосов
0 ответов

Я хочу создать искровой фрейм данных, используя Presto.В настоящее время я могу создать фрейм...

Aviral Srivastava / 27 июня 2019
0 голосов
0 ответов

Недавно я столкнулся с ситуацией, когда пишу данные, я пишу данные с перераспределением по годам,...

drlol / 27 июня 2019
0 голосов
0 ответов

Я запускаю задание на тестовом автономном Spark в кластерном режиме, но я не могу контролировать...

Batsu / 27 июня 2019
0 голосов
0 ответов

Моя программа spark отправляет задачи в пул потоков в очереди синхронной блокировки. Начало...

CSU_little_young / 27 июня 2019
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...