Вопросы с тегом апаш-искра - PullRequest

Вопросы с тегом апаш-искра

0 голосов
0 ответов

У нас есть полная фляга, которую мы используем на EMR, в которой хранятся все наши искровые задания...

Zach H / 07 ноября 2019
0 голосов
1 ответ

Рассмотрим пример: У меня есть кластер с 5 узлами, и каждый узел имеет 64 ядра с 244 ГБ памяти. Я...

Venkat Dabri / 07 ноября 2019
0 голосов
2 ответов

Сложность в том, что я стараюсь избегать UDF как можно больше. У меня есть набор данных "wordsDS",...

mjat / 07 ноября 2019
0 голосов
0 ответов

Я пытаюсь реализовать некоторый код в Scala Spark, в котором у меня есть мультиклассовая модель...

Regressor / 07 ноября 2019
1 голос
0 ответов

Я отправляю поток данных в Azure EventHub со следующим кодом, использующим Microsoft.Hadoop.Avro .....

m1nkeh / 07 ноября 2019
0 голосов
0 ответов
0 голосов
2 ответов

Я знаю, что файлы паркета разделяются, если они хранятся в хранилище блоков. Например, хранятся в...

Arran Duff / 07 ноября 2019
0 голосов
0 ответов

Я использую Cosmos DB Connector для Spark. Можно ли использовать запросы Mongo Shell "JSON-style" с...

codepringle / 07 ноября 2019
0 голосов
0 ответов
0 голосов
0 ответов

У меня есть много столбцов в моем фрейме данных sparklyr (около 70), некоторые из которых должны...

Chloe Smith / 07 ноября 2019
0 голосов
2 ответов

Я хочу создать несколько столбцов из одного столбца из Dataframe, используя запятую в Java Spark. У...

Tamil / 07 ноября 2019
0 голосов
2 ответов

Моя схема: StructField[] fields = new StructField[] { DataTypes.createStructField("id",...

Sterling Duchess / 07 ноября 2019
0 голосов
1 ответ
1 голос
1 ответ

Я пытаюсь использовать сохраненную модель Mllib для прогнозирования настроений при передаче данных...

JoSKa / 07 ноября 2019
0 голосов
1 ответ

Я пытаюсь понять оценку Спарк. Существует таблица table_name, которая разделена на partition_column

Dawid / 07 ноября 2019
0 голосов
0 ответов

например: +------+ |items | +------+ | 1| | 14| | 11| | 3| | 0| | 0,13| | 8| | 7| | 7,11| | 13|...

AkhilaV / 07 ноября 2019
0 голосов
2 ответов

В своем приложении для потоковой передачи данных я пытаюсь выполнить потоковую передачу данных из...

chaitra k / 07 ноября 2019
0 голосов
0 ответов

Я знаю, что сравнение стратегий объединения - сложная проблема. Но в обычных случаях я могу...

Bostonian / 07 ноября 2019
0 голосов
0 ответов

У меня есть CSV, для которого мне нужно создать df, который имеет столбец ArrayType, проблема в том...

Andy Smith / 07 ноября 2019
0 голосов
1 ответ

Я знаю, что мы могли бы явно ANALYZE таблицу в Spark SQL, чтобы мы могли получить некоторую точную...

Bostonian / 07 ноября 2019
0 голосов
0 ответов

Я пытаюсь передать большой (~ 30 ГБ) фрейм данных в pandas_udf в spark следующим образом: @f

Megan / 07 ноября 2019
0 голосов
1 ответ

Базовый источник данных хранится в формате Parquet и предоставляется через Hive. Можно ли...

Bostonian / 07 ноября 2019
1 голос
2 ответов

Обновленный вопрос Что мне непонятно => в ShuffleMapStage каждый Mapper создаст .data и .index file...

SanBan / 07 ноября 2019
0 голосов
1 ответ

Я пытаюсь записать фрейм данных pyspark в базу данных Postgres со следующим кодом: mode =...

DBA108642 / 07 ноября 2019
0 голосов
0 ответов

Я использовал Flintrock для запуска кластера Spark на AWS и остановил его после его использования....

Bo Han / 07 ноября 2019
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...