Вопросы с тегом pyspark - PullRequest

Вопросы с тегом pyspark

0 голосов
1 ответ

У меня есть фрейм данных в Pyspark, созданный с использованием ниже. df = sqlContext

Question_bank / 04 июля 2018
0 голосов
1 ответ

Я читаю csv-файл, используя Pandas, это двухбалочный фрейм данных, а затем я пытаюсь преобразовать...

Mr.Panchamia / 03 июля 2018
0 голосов
1 ответ

В Spark 2.1 с использованием pyspark, если вы хотите запросить таблицу (например, из HDP), вы...

Micah Pearce / 03 июля 2018
0 голосов
1 ответ

Получение TypeError при отправке с помощью spark-submit --py-files udf TypeError: 'in...

marjun / 03 июля 2018
0 голосов
1 ответ

Мне нужно перебирать строки в pyspark.sql.dataframe.DataFrame.DataFrame. В прошлом я делал это в...

DroppingOff / 03 июля 2018
0 голосов
1 ответ

Мне нужно импортировать CSV файл в Spark и преобразовать его в DF, а затем в RDD перед обработкой....

Stefano / 03 июля 2018
0 голосов
0 ответов

Я читал о том, как профилировать мой искровой кластер. Примечание: я использую pyspark. Мне удалось...

claudius / 03 июля 2018
0 голосов
0 ответов

Я работаю с pyspark с версией spark 2.3.1. Я только что установил его и попробовал поиграть с ним...

legoat / 03 июля 2018
0 голосов
1 ответ

Я использую CountVectorizer, чтобы подготовить набор данных для ML. Я хочу отфильтровать редкие...

JB5 / 03 июля 2018
0 голосов
1 ответ

У меня есть фрейм данных PySpark с одним из столбцов (features), который является разреженным...

dportman / 02 июля 2018
0 голосов
2 ответов

У меня есть фрейм данных в Pyspark df.show() +---+----+-------+----------+-----+------+ |...

Question_bank / 02 июля 2018
0 голосов
1 ответ

Рассмотрим следующий фрейм данных: #+------+---+ #|letter|rpt| #+------+---+ #| X| 3| #| Y| 1| #|...

pault / 02 июля 2018
0 голосов
1 ответ

У меня есть кадр данных следующим образом - a | b | c [1] | [3,4,5,6] | [7,8,9,10] мне нужен вывод...

Visualisation App / 02 июля 2018
0 голосов
1 ответ

Кажется, одно из моих предположений было неверным в отношении порядка в СДР ( относящегося )....

icarus / 02 июля 2018
0 голосов
1 ответ

Существует ли функция Spark SQL для добавления часов, минут и секунд в существующий столбец отметки...

Shankar / 02 июля 2018
0 голосов
0 ответов

Я пытаюсь преобразовать большой сжатый CSV-файл в паркет с помощью PySpark. Я довольно новичок в...

Sanjay Kumar / 02 июля 2018
0 голосов
2 ответов

Я читаю CSV-файл с помощью следующего кода: - from pyspark.sql import SparkSession spark =...

user8482601 / 02 июля 2018
0 голосов
2 ответов

Я пытаюсь получить тип данных столбца из кадра данных Вот пример кода: print training_data.schema...

Pratap D / 02 июля 2018
0 голосов
1 ответ

Я пытаюсь разбить несколько довольно сложных вложенных json на более рационализированный формат, но...

Grizzle / 01 июля 2018
0 голосов
0 ответов

Я пробовал агрегатную функцию, которая преподавалась в видео лекции. Я столкнулся с ошибкой при ее...

Hariprasath Thiagarajan / 01 июля 2018
0 голосов
1 ответ
0 голосов
2 ответов

Я хочу преобразовать несколько столбцов с одинаковыми категориальными значениями, используя...

beapen / 01 июля 2018
0 голосов
0 ответов

Я создал модель LDA с библиотекой ML pyspark. Я на последних шагах, чтобы просмотреть темы . Мне...

lpt / 30 июня 2018
0 голосов
3 ответов

У меня есть СДР (key, (val1,val2)). Для этого rdd я хотел бы применить функцию reduceByKey, и мое...

Sriram / 30 июня 2018
0 голосов
0 ответов

Мы пишем приложение Stream Streaming, чтобы читать сообщения kafka методом createStream, и интервал...

Rajkumar / 30 июня 2018
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...