Вопросы с тегом pyspark - PullRequest

Вопросы с тегом pyspark

0 голосов
1 ответ

У меня есть даты с прямым порядком байтов: ГГГГММДД в ​​формате CSV. Когда я использую простые...

Sara / 01 сентября 2018
0 голосов
1 ответ

Я пытаюсь запустить простой скрипт Python на своем автономном кластере Spark. Кластер имеет один...

joe / 01 сентября 2018
0 голосов
1 ответ

schema_comment= StructType([ StructField("id", StringType(), True),...

Sara / 01 сентября 2018
0 голосов
3 ответов

У меня есть датафрейм, примерно такой +---+---------+--------------------+ | id| name| actor|...

oya163 / 31 августа 2018
0 голосов
0 ответов

Я получил следующую ошибку в моей .describe() функции с использованием PySpark. Кажется, все...

Reza / 31 августа 2018
0 голосов
1 ответ

У меня есть файл типа json (не настоящая структура json), но я преобразовал его в json и прочитал...

user2883350 / 31 августа 2018
0 голосов
0 ответов

Я использую блоки данных Azure с Pyspark и CosmosDB с API MongoDB. Следующая команда Pyspark...

tom1991te / 31 августа 2018
0 голосов
1 ответ

Предположим, у нас есть следующий DataFrame в (Py) Spark. (Я взял данные из этого вопроса .)...

H. Shindoh / 31 августа 2018
0 голосов
1 ответ

Я хочу подтвердить, что значения столбца PySpark DataFrame одинаковы во всех строках. Например,...

Amanda / 31 августа 2018
0 голосов
0 ответов
0 голосов
0 ответов

Я использую PySpark 2.2.1 и пытаюсь StandardScale значения своих функций через spark StandardScaler

Adam Bacon / 31 августа 2018
0 голосов
1 ответ

Я хочу преобразовать приведенный ниже код панды в pysaprk. d =...

Mithril / 31 августа 2018
0 голосов
2 ответов

У меня есть около 10000 CSV-файлов, каждый из которых содержит 14 столбцов. Они содержат данные,...

Ehs4n / 31 августа 2018
0 голосов
1 ответ

У меня есть установка Spark Standalone Cluster на машине EC2. Кластер содержит в общей сложности 1...

Om Prakash / 31 августа 2018
0 голосов
0 ответов

Я установил Anaconda3 (64 бита) на свой локальный компьютер с Windows, где установлена ​​Spyder IDE

Koushik Chandra / 31 августа 2018
0 голосов
1 ответ

Если у вас есть несколько человек, использующих ноутбуки Zeppelin (0.7.3) для создания прототипов в...

kingledion / 30 августа 2018
0 голосов
0 ответов

Кажется, что все эти функции выполняют довольно похожие операции. OneHotEncoderEstimator в...

Keshinko / 30 августа 2018
0 голосов
1 ответ

Я работаю над процессом в pyspark, в котором у меня есть фрейм данных, и пытаюсь добавить еще один...

Luiz Fernandes / 30 августа 2018
0 голосов
1 ответ

В фрейме данных spark у меня есть 1 столбец, содержащий список в виде строк. Я хочу объединить...

Surbhi Jain / 30 августа 2018
0 голосов
0 ответов

Я пытаюсь понять, как работает датафрейм. Я использую Spark 2+. Я хотел прочитать файл и передать...

Aavik / 30 августа 2018
0 голосов
1 ответ

У меня есть функция, которая пытается передать широковещательную переменную в UDF. Функция выглядит...

lserlohn / 30 августа 2018
0 голосов
0 ответов

Я использую клей AWS для создания заданий ETL - написание сценариев с использованием Pyspark....

oli5679 / 30 августа 2018
0 голосов
0 ответов

У меня есть pyspark DataFrame. data.show(2) +--------------+------+ |number_reviews|_count|...

lpt / 30 августа 2018
0 голосов
1 ответ

У меня есть датафрейм с несколькими продуктами для каждой даты по клиенту. В новой колонке я...

akhil sood / 30 августа 2018
0 голосов
1 ответ

Мне было интересно, есть ли способ, как выполнить группировку интерактивных переменных (аналогично...

bazinac / 30 августа 2018
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...