Вопросы с тегом pyspark - PullRequest

Вопросы с тегом pyspark

0 голосов
2 ответов

У меня ранее был установлен PySpark в виде пакета Python, который я установил через pip, недавно я...

Michael Naples / 09 октября 2018
0 голосов
1 ответ

У меня есть фрейм данных, который содержит следующие столбцы: ID Scheduled Date 241 10/9/2018 423...

PineNuts0 / 09 октября 2018
0 голосов
1 ответ

Учитывая pyspark.sql.dataframe.DataFrame x: name day earnings revenue Oliver 1 100 44 Oliver 2 200...

Zennie / 09 октября 2018
0 голосов
0 ответов

Предположим, у нас есть pyspark для фрейма данных с: key столбцом, по которому мы хотим...

ysearka / 09 октября 2018
0 голосов
3 ответов

Я пытался использовать оба способа для установки spark.dynamicAllocation.minExecutors, но похоже,...

XIN / 09 октября 2018
0 голосов
1 ответ

У меня есть таблица улья, которая разделена на многие страны.Я хочу загрузить данные конкретного...

vikrant rana / 09 октября 2018
0 голосов
0 ответов

У нас есть поток Кафка, который использует Avro.Мне нужно подключить его к Spark Stream, используя...

GihanDB / 09 октября 2018
0 голосов
0 ответов

Я хочу прочитать данные из HDFS и внедрить машинное обучение, используя Tensorflow поверх него.Я не...

animal / 09 октября 2018
0 голосов
0 ответов

Я разрабатываю скрипт прогнозирования Python с использованием потоковой передачи Spark (PySpark) и...

Anish Sharma / 09 октября 2018
0 голосов
1 ответ

Я скручиваю некоторые фреймы данных с использованием partitionBy на S3.Создается структура папок,...

darkmatter / 09 октября 2018
0 голосов
1 ответ

У меня есть 4 текстовых файла. 2 файла содержат данные таблиц базы данных, а другие 2 содержат...

Sai / 09 октября 2018
0 голосов
1 ответ

Я пытаюсь выполнить групповое среднее значение для фрейма данных pyspark, используя функцию...

Bharat Sharma / 09 октября 2018
0 голосов
1 ответ

У нас есть поток Кафка, который использует Avro.Мне нужно подключить его к Spark Stream.Я использую...

GihanDB / 09 октября 2018
0 голосов
0 ответов

В чем разница между никогда не останавливать SparkContext и StreamingContext? DStream имеет...

suiwenfeng / 09 октября 2018
0 голосов
3 ответов

У меня есть этот код df.coalesce (40) print(" after coalisce getting nb partition " +...

momo / 09 октября 2018
0 голосов
0 ответов

Я пытаюсь обучить модель Word2Vec с помощью pySpark в Windows 10. Я установил py4j с помощью...

Michael Naples / 09 октября 2018
0 голосов
0 ответов

Код ниже import findspark findspark.init() import pyspark import random sc = pyspark

Anshuman Kirty / 08 октября 2018
0 голосов
0 ответов

Я работаю с spark2.3 и использую следующие библиотеки из pyspark.sql.functions import...

mina / 08 октября 2018
0 голосов
1 ответ

Я запускаю кластер pyspark на AWS EMR и использую Jupyter для драйвера pyspark.Недавно скрипт не...

Michael Hoffman / 08 октября 2018
0 голосов
0 ответов

Я выполняю довольно простую работу Spark: прочитайте пару наборов данных Parquet (10-100 ГБ) каждый...

pay / 08 октября 2018
0 голосов
1 ответ

Я попытался сохранить свою модель машинного обучения в pyspark для лазурного блоба.Но это приводит...

Affan / 08 октября 2018
0 голосов
2 ответов

Я работаю с PySpark и загружаю файл csv.У меня есть столбец с числами в европейском формате, что...

cph_sto / 08 октября 2018
0 голосов
2 ответов

Я довольно новичок в потоковом программировании.У нас есть Kafka Stream, который использует Avro. Я...

GihanDB / 08 октября 2018
0 голосов
1 ответ

Я работаю над Spark 2.3, Python 3.6 с pyspark 2.3.1 У меня есть Spark DataFrame, где каждая запись...

RaspyVotan / 08 октября 2018
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...