Вопросы с тегом апаша-искра - PullRequest

Вопросы с тегом апаша-искра

1 голос
1 ответ
1 голос
1 ответ

У меня есть мой первый фрейм данных df, который содержит start_date и значение, и мой второй фрейм...

sr9419 / 05 октября 2019
5 голосов
1 ответ

Я хотел бы написать свой искровой фрейм данных в виде набора файлов JSON и, в частности, каждый из...

enneppi / 04 октября 2019
1 голос
0 ответов

Настройка У меня есть Apache Spark (2.4.4), работающий в Linux (Ubuntu 18.04.3 LTS (GNU / Linux 4

Ilker Murat Karakas / 04 октября 2019
2 голосов
1 ответ

Мы создаем приложение Spark в Scala с конфигурацией HOCON, конфигурация называется application.conf

pgruetter / 04 октября 2019
0 голосов
0 ответов

Я пишу некоторый код для сохранения DataFrame в базе данных кустов, используя presto df.write

Ahmed Adnane A'mil / 04 октября 2019
1 голос
0 ответов

Я хочу отправить искровое задание в кластер Azure hdInsights из потока воздуха, я не хочу...

vermaji / 04 октября 2019
0 голосов
1 ответ

Попытка реализовать алгоритм регрессора дерева решений для некоторых обучающих данных, но когда я...

wookieluvr13 / 04 октября 2019
1 голос
0 ответов

В настоящее время я построил модель BucketedRandomProjectionLSH, чтобы вычислить сходство данных по...

Louis Luk / 04 октября 2019
3 голосов
1 ответ

У меня есть программа Spark, которая запускается локально на моей машине с Windows. Я использую...

Alon / 04 октября 2019
0 голосов
0 ответов

Надеясь, что кто-то может помочь пролить свет на это. Я читаю 35Gb .csv с S3. Я ожидал, что он...

nciao / 04 октября 2019
0 голосов
0 ответов

Я пытаюсь загрузить файл с меткой времени в мою таблицу кустов, сохранив фрейм данных в путь hdfs....

James Davinport / 03 октября 2019
0 голосов
1 ответ

Я хотел бы сделать вычисления для получения 5 лучших ключевых слов в каждой стране и внутри метода,...

Sidi Chang / 03 октября 2019
0 голосов
0 ответов

Предположим, у меня есть следующие два набора данных. Я пытаюсь связать продукты под рукой с их...

Shawn / 03 октября 2019
0 голосов
0 ответов

Я сталкиваюсь с тем, что, я думаю, является основной проблемой, но мне на удивление трудно найти...

Jay Cee / 03 октября 2019
0 голосов
0 ответов

Я получаю следующую ошибку при работе на локальном EC2 с 'hadoop-3.1.1' и 'spark-2.4

Kirti / 03 октября 2019
0 голосов
1 ответ

У меня есть pyspark.sql.dataframe.DataFrame с 1300 строками и 5 столбцами. Я использую следующее...

ecp / 03 октября 2019
0 голосов
0 ответов

Я конвертирую большой CSV-файл в файл Parquet (pyspark), пока он выглядит хорошо, пока число строк...

syv / 03 октября 2019
4 голосов
1 ответ

У меня есть следующий набор данных: id email Date_of_purchase time_of_purchase 1 abc@gmail.com...

user3642360 / 03 октября 2019
0 голосов
1 ответ

Я пытаюсь читать файлы Excel из COS с помощью spark, например: def readExcelData(filePath: String,...

Ayan Biswas / 03 октября 2019
0 голосов
1 ответ

Я хочу реализовать следующую формулу, используя pyspark: Lx_BOP(1) = 1 Lx_BOP(n+1) = Lx_BOP(n) * (1...

Eran Witkon / 03 октября 2019
0 голосов
0 ответов

Я пытаюсь использовать соединитель хранилища Hive ( hive-warehouse-connector_2.11-1.0.0.3.1.0.53-1

Samrat Mitra / 03 октября 2019
0 голосов
2 ответов

Предположим, что у нас есть фрейм данных PySpark с двумя столбцами, ID (он уникален) и VALUE. Мне...

WorkBench / 03 октября 2019
1 голос
0 ответов

Я пытаюсь заархивировать два диска с одинаковым количеством элементов. Но при вызове zip я получаю...

wookieluvr13 / 02 октября 2019
0 голосов
1 ответ

Я просто пытаюсь создать таблицу в кусте, которая хранится в виде файла паркета, а затем...

Coder123 / 02 октября 2019
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...