Вопросы с тегом pyspark - PullRequest

Вопросы с тегом pyspark

0 голосов
0 ответов

Предположим, у меня есть 1000 столбцов. Как применить QuantileDiscretizer для всех столбцов? Это...

priya / 06 марта 2019
0 голосов
0 ответов

Как мне проверить количество узлов и ядер, доступных в Google Colab? Я запускаю файл PySpark. Я...

someoneOutThere / 06 марта 2019
0 голосов
1 ответ

Я использую ноутбук Jupyter.У меня есть фрейм данных pyspark, который я загрузил с помощью команды...

Jason Bourne / 06 марта 2019
0 голосов
1 ответ

Я новичок в PySpark и пытаюсь читать HDFS-файлы (на которых созданы таблицы кустов) и создавать...

rightjoin / 06 марта 2019
0 голосов
0 ответов

У меня есть фрейм данных, который состоит из 3 строк и более 20 столбцов (даты) +----+-----+-----+...

Gerasimos / 05 марта 2019
0 голосов
0 ответов

Я пытаюсь использовать тему Kafka, которая была сериализована в Avro, и мне нужно выяснить, как ее...

anonuser1234 / 05 марта 2019
0 голосов
0 ответов

У меня следующая проблема: я использую PySpark для чтения таблицы из Snowflake в качестве кадра...

Gerasimos / 05 марта 2019
1 голос
1 ответ

У меня установлено приложение Spark Streaming, которое использует тему Kafka, и мне нужно...

anonuser1234 / 05 марта 2019
2 голосов
1 ответ

Я использую pyspark и Flask для интерактивной искры в качестве сервисного приложения. Мое...

nevenjovic / 05 марта 2019
0 голосов
2 ответов

Я новичок в pyspark, у меня есть скрипт, как показано ниже; joinedRatings=ratings.join(ratings)...

tfirinci / 05 марта 2019
0 голосов
1 ответ

Я использую pyspark для генерации фрейма данных, в котором мне нужно обновить столбец 'amt'...

Nabarun Chakraborti / 05 марта 2019
0 голосов
1 ответ

У меня есть RDD с 3 столбцами (road_idx, snodeidx, enodeidx).Выглядит это так: (roadidx_995, 1138,...

张晏梓 / 05 марта 2019
0 голосов
0 ответов

У меня есть огромный Dataframe, из которого мне нужно сгенерировать один CSV в BLOB-объекте Azure....

Ayan / 05 марта 2019
0 голосов
1 ответ

Я пытаюсь найти и удалить дубликаты значений, которые в данный момент хранятся в файле YAML. Пока я...

Yogesh Sharma / 05 марта 2019
0 голосов
1 ответ

Я использую следующий код для блоков данных: dataToShow = jDataJoined.\ withColumn('id',...

dierre / 05 марта 2019
0 голосов
0 ответов

Я определил пример задачи Airflow, в которой я хотел запустить запрос PrestoDB, а затем задание...

Shubham A. / 05 марта 2019
0 голосов
0 ответов

Я хочу суммировать с окном. данные типа: user_id timestamp date event 0040b5f0 2018-01-22 13:04:32...

muzhen xv / 05 марта 2019
0 голосов
1 ответ

У меня эта ошибка в записной книжке Jupyter под управлением Python 3.6.5 и в моей оболочке Python...

Jabernet / 05 марта 2019
0 голосов
0 ответов

Я следовал этому руководству , чтобы классифицировать изображения с помощью Apache Spark.Статья...

M Dhamankar / 05 марта 2019
0 голосов
1 ответ

У меня есть приложение для потокового Python со структурой pyspark, настроенное так: from pyspark

anonuser1234 / 05 марта 2019
0 голосов
1 ответ

Я использую pyspark-2.4.0, и большая работа продолжает зависать со следующим сообщением об ошибке...

Matthias / 04 марта 2019
0 голосов
1 ответ

Я определил следующую функцию: def test_function(string): import nltk from nltk.sentiment.vader...

EddieZahoree / 04 марта 2019
0 голосов
1 ответ

Я пытаюсь выучить Spark, следуя некоторому примеру уровня приветствия, например ниже, используя...

Indominus / 04 марта 2019
0 голосов
1 ответ

Я попытался импортировать другой файл python в моей текущей программе pyspark, используя...

Neha patel / 04 марта 2019
0 голосов
0 ответов

У меня есть несколько заданий, в которых для выполнения некоторых задач используется следующая...

j_code_evans / 04 марта 2019
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...