Вопросы с тегом pyspark - PullRequest

Вопросы с тегом pyspark

0 голосов
1 ответ

Я пытаюсь написать скрипт в блоках данных, который будет выбирать файл на основе определенных...

Carltonp / 02 января 2019
0 голосов
1 ответ

Я запускаю простое приложение spark, чтобы получить файл из s3 в rdd и преобразовать его в фрейм...

Javaria Nawaz / 02 января 2019
0 голосов
1 ответ

У меня есть данные, как показано ниже: +-----------+------------+-------------+-----------+ |...

Hakim / 02 января 2019
0 голосов
1 ответ

Я пытаюсь преобразовать тип данных String в тип данных Timestamp, но в результате получаю NONE...

syv / 02 января 2019
0 голосов
1 ответ

Я использую кластер искр с двумя узлами, каждый из которых имеет двух исполнителей (каждый...

Vivek / 02 января 2019
0 голосов
0 ответов

Я пытаюсь вычислить взвешенное (основанное на длительности) скользящее среднее для кадра данных с...

delivaldez / 02 января 2019
0 голосов
2 ответов

Я впервые пытаюсь запустить Spark Action со скриптом Pyspark в Oozie. Обратите внимание, что я...

El Mehdi OUAFIQ / 02 января 2019
0 голосов
0 ответов

Я провел преобразование tf-idf, и теперь я хочу получить ключи и значения из результата. Я...

A story-teller / 01 января 2019
0 голосов
0 ответов

Я вижу странное поведение при выполнении моей программы.Позволь мне объяснить. Я написал...

White Shadows / 01 января 2019
0 голосов
1 ответ

У меня есть RDD в pyspark вида (ключ, другие вещи), где "другие вещи" - это список полей.Я хотел бы...

Panda / 01 января 2019
0 голосов
0 ответов

похоже, что нет способа установить порог для модели GBTClassifier в pyspark.он появляется в...

sparkly / 01 января 2019
0 голосов
1 ответ

Я правильно делаю?У меня есть столбец отметки времени, который я конвертирую в дату первого месяца....

user1761806 / 31 декабря 2018
0 голосов
1 ответ

Это было давно, но я вернулся еще раз .. Проблема: Когда я пытаюсь преобразовать любой столбец типа...

n1c9 / 31 декабря 2018
0 голосов
1 ответ

У меня был некоторый код Pyspark, который работал с образцом BLOB-файла csv, а затем я решил...

user1761806 / 31 декабря 2018
0 голосов
0 ответов

У меня есть фрейм данных Pyspark, который я конвертирую в Pandas df, чтобы на нем можно было...

user1761806 / 31 декабря 2018
0 голосов
3 ответов

Мне нужно просканировать таблицу Hive и добавить значения из первой записи в последовательности ко...

DinoG / 31 декабря 2018
0 голосов
1 ответ

Во время работы моей программы spark в ноутбуке jupyter я получил сообщение об ошибке «Задание...

Neha patel / 31 декабря 2018
0 голосов
2 ответов

Извините, я новичок в питоне.При изучении pyspark я наткнулся на такую ​​команду sc = SparkSession

Naz / 30 декабря 2018
0 голосов
1 ответ

Я построил модель дерева решений с использованием Pyspark, и я хочу развернуть эту модель с помощью...

Abhishek Sawant / 30 декабря 2018
0 голосов
2 ответов

Я установил pysark2.1 с hadoop2.6 на Eclipse (плагины Eclipse: PyDev), используя Python 3.7, JRE 8,...

Chaymae Ahmed / 30 декабря 2018
0 голосов
2 ответов

у меня есть эта схема данных: df: root |-- id: long (nullable = true) |-- a: array (nullable =...

reeena11 / 30 декабря 2018
0 голосов
1 ответ

Как передать переменные в запрос spark.sql в pyspark?Когда я запрашиваю таблицу, происходит сбой с...

Ravindra Solanki / 30 декабря 2018
0 голосов
1 ответ

Я использовал kafka-python для обработки сообщений в кластере kafka: consumer = KafkaConsumer...

richardj / 30 декабря 2018
0 голосов
0 ответов

Я установил спарк в Mac.Согласно документации здесь , «пользователи, у которых нет существующего...

user3138594 / 30 декабря 2018
0 голосов
0 ответов

У меня есть требование к проекту, в котором я должен сначала собрать события, используя flume, и...

ram / 30 декабря 2018
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...