Вопросы с тегом pyspark - PullRequest

Вопросы с тегом pyspark

0 голосов
1 ответ

У меня есть несколько RDD, каждый из которых состоит из списка пользователей. Как я могу получить...

sleepy whiskey / 27 августа 2018
0 голосов
1 ответ

У меня есть Spark Dataframe с двумя столбцами, которые являются плотными векторами. Я хочу...

Stergios / 27 августа 2018
0 голосов
0 ответов
0 голосов
0 ответов

Я работаю с Spark 2.1, чтобы поместить файл csv в таблицу HIVE, которую он тоже создает.Но я...

learner / 27 августа 2018
0 голосов
2 ответов

У меня есть фрейм данных pyspark, который содержит столбцы, как показано Unique_id date type 1...

ajay mishra / 27 августа 2018
0 голосов
1 ответ

Я пытаюсь использовать функцию SparkContext.binaryFiles для обработки набора ZIP-файлов.Настройка...

fatdragon / 27 августа 2018
0 голосов
1 ответ

У меня есть фрейм данных pyspark, и я хочу отфильтровать фрейм данных со столбцами A и B. Теперь я...

Aditya Thakkar / 27 августа 2018
0 голосов
1 ответ

Мой искровой (pyspark) ETL, использующий оконную функцию, перестал работать.Интересно, есть ли...

MrCartoonology / 27 августа 2018
0 голосов
1 ответ

У меня есть образец данных ниже, и я написал свой код для преобразования словаря в сумму словарного...

Nattawat Khamphakdee / 27 августа 2018
0 голосов
0 ответов

Когда я пытаюсь запустить spark из консоли, все работает нормально: pyspark Все хорошо. Но когда я...

user924088 / 27 августа 2018
0 голосов
1 ответ

Я пытаюсь соединить два фрейма данных df1 и df2, которые имеют такое же имя столбца, что и...

sam / 26 августа 2018
0 голосов
0 ответов

Ниже приведено содержимое файла spark-defaults.conf.template: spark.master spark://10.10.51.93:7077...

Sriram Raghav / 26 августа 2018
0 голосов
0 ответов

Я пытаюсь прочитать WARC-записи в PySpark, используя пользовательский формат ввода.Тот же метод...

Akshansh Gupta / 26 августа 2018
0 голосов
0 ответов

Я могу запустить следующий код и получить включенные выходные данные, но он не работает, если один...

Abraham / 25 августа 2018
0 голосов
1 ответ

У меня есть датафрейм, импортированный из CSV с двумя столбцами (среди прочих): дата и время.Date -...

Raiden616 / 25 августа 2018
0 голосов
1 ответ

У меня есть итератор, который работает с последовательностью документов WARC и выдает измененные...

Akshansh Gupta / 25 августа 2018
0 голосов
1 ответ

Я использую годовой доход взрослого населения от UCI. У меня есть фрейм данных с категориальной...

sneaky_lobster / 25 августа 2018
0 голосов
1 ответ

Я получаю TypeError, когда пытаюсь преобразовать СДР объекта Price в Pair RDD. Пример кода:...

Shankar / 25 августа 2018
0 голосов
1 ответ

Я закодировал шестнадцатеричный код (идентификатор устройства): 9F1D8E8BA2194CD29CC744083914535A В...

Nitesh Gupta / 25 августа 2018
0 голосов
0 ответов

У меня есть приложение, которое использует PySpark для извлечения функций, но приложение всегда...

Alex / 25 августа 2018
0 голосов
1 ответ

У меня есть фрейм данных, в котором много столбцов (более 50 столбцов), и я хочу выбрать все...

prasannads / 25 августа 2018
0 голосов
0 ответов

Я обучил модель PySpark ML работе, отправленной с использованием spark-submit. Я не могу загрузить...

Marc S / 24 августа 2018
0 голосов
1 ответ

У меня есть два кадра данных, DF1 и DF2, DF1 является ведущим, а DF2 является дельтой. Данные из...

navin / 24 августа 2018
0 голосов
1 ответ

Часть кода ниже пытается сделать следующее: Для каждого customer_code в sdf1 проверьте,...

Charles Van Damme / 24 августа 2018
0 голосов
2 ответов

Я хочу запустить пользовательскую функцию для столбца данных. Столбец содержит длинную строку,...

Moca / 24 августа 2018
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...