Вопросы с тегом pyspark - PullRequest

Вопросы с тегом pyspark

0 голосов
1 ответ

Предположим, у меня есть список столбцов, например: col_list = ['col1','col2']...

Amita Rawat / 28 февраля 2019
0 голосов
2 ответов

У меня датафрейм выглядит следующим образом. A Start End 1 1578 1581 1 1789 1790 2 1800 1802 начало...

Eleanor / 28 февраля 2019
0 голосов
1 ответ

Я пытаюсь обучить модель классификации распределенным способом.Я использую библиотеку...

Vamsi Nimmala / 28 февраля 2019
0 голосов
0 ответов

Мое требование несколько похоже на этот вопрос как использовать nextval () в драйвере jdbc postgres...

Prabakaran Vnc / 28 февраля 2019
0 голосов
1 ответ

Я хочу создать столбец на основе значения существующего столбца.Везде, где есть знак плюс, мы хотим...

Koushik Chandra / 28 февраля 2019
0 голосов
1 ответ

Я работаю в распределенной среде, чтобы отследить модель машинного обучения keras, поэтому мне...

Vamsi Nimmala / 28 февраля 2019
0 голосов
0 ответов

Данные можно найти здесь, это относительно небольшой файл json, который я нашел на github.Я пытаюсь...

MrL / 27 февраля 2019
0 голосов
0 ответов

Когда я запускаю алгоритм подключенных компонентов в GraphFrames, появляется огромный компонент с...

Ron F / 27 февраля 2019
0 голосов
0 ответов

Я новичок в мире искр :-).Попытка написать рабочий процесс слияния объединяет маленькие журналы в...

Whispererli / 27 февраля 2019
0 голосов
1 ответ

Вот картина ситуации: Мой код: rdd = spark.read.format("avro").load(paths).rdd

user1302130 / 27 февраля 2019
0 голосов
1 ответ

Я создал таблицу ORC в Hive с разделами. Данные загружаются в HDFS с использованием Apache pig в...

Amrutha K / 27 февраля 2019
0 голосов
1 ответ

У меня есть искровой фрейм данных с этой схемой: root |-- product_id: integer (nullable = true) |--...

Unaipg / 27 февраля 2019
0 голосов
0 ответов

Я запускаю pyspark в кластере EMR, но получаю сообщение об ошибке при преобразовании SQL-запроса...

funkyFunk / 27 февраля 2019
0 голосов
0 ответов

Это мои свойства конфигурации искры.Мой главный узел находится в операционной системе Linux. spark...

Taimur Islam / 27 февраля 2019
0 голосов
1 ответ

У меня следующий код pyspark, который я использую для чтения файлов журнала из журнала / каталога,...

user1457821 / 27 февраля 2019
0 голосов
0 ответов

мы читаем данные из кинезиса и выводим их в файл, используя поток структуры искры.Реализация...

Vish / 27 февраля 2019
0 голосов
1 ответ

У меня таблица выглядит следующим образом: +----+------+-----+-------+ |time|val1 |val2 | class|...

lserlohn / 27 февраля 2019
0 голосов
0 ответов

В настоящее время я работаю с 3 фреймами данных и объединяю их вместе, начиная с фрейма network и...

sectechguy / 27 февраля 2019
0 голосов
1 ответ

У меня есть фрейм данных искры df1 id transactions 1 [1, 2, 3, 5] 2 [1, 2, 3, 6] 3 [1, 2, 9, 8] 4...

priya / 27 февраля 2019
0 голосов
0 ответов

Я пытаюсь вычислить скользящее среднее значение цены за последние шесть месяцев в pyspark. В...

gr.kr / 26 февраля 2019
0 голосов
1 ответ

Я бы хотел получить вес для узлов дерева из сохраненного (или несохраненного)...

Jeff Saremi / 26 февраля 2019
0 голосов
1 ответ

У меня есть файл csv presence.csv в моем файле данных: TIME,RESULT,PARENTLOCALIZATIONCODE...

Steven / 26 февраля 2019
0 голосов
1 ответ

В настоящее время я работаю над Spark версии 2.1.0, в рамках моей работы по сбору данных я должен...

Ajay Kharade / 26 февраля 2019
0 голосов
0 ответов

Я хочу взять все предыдущие строки в наборе данных, которые соответствуют определенным критериям...

Francisco Ferreira / 26 февраля 2019
0 голосов
1 ответ

Я реализовал алгоритм классификации в Spark, который включает в себя расчет расстояний между...

oulenz / 26 февраля 2019
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...