Вопросы с тегом pyspark - PullRequest

Вопросы с тегом pyspark

0 голосов
0 ответов

Я думаю, что, возможно, наткнулся на ошибку и хотел узнать мнение других людей. Я запускаю...

Antonio Ye / 12 мая 2018
0 голосов
2 ответов

У меня есть СДР, например: rdd = sc.parallelize(['a','b','a'...

YOLO / 12 мая 2018
0 голосов
1 ответ

Я запускаю простую программу и пытаюсь напечатать вывод файла, используя sc , но когда я запускаю...

Big_Data / 12 мая 2018
0 голосов
0 ответов

Когда я запускаю pyspark без sudo в командной строке в Ubuntu, я получаю следующую ошибку: Вам...

OmG / 12 мая 2018
0 голосов
1 ответ

Как мне получить ключи сгруппированных spark-dataframe? И еще вопрос: Что включает в себя pyspark

Zahra Ghodsi / 12 мая 2018
0 голосов
0 ответов

Если бы кто-нибудь, знакомый с python, java и spark, успел превратить эти коды в python-spark,...

Lucy / 12 мая 2018
0 голосов
1 ответ

У меня есть столбец в фрейме данных в pyspark, например, «Col1» ниже. Я хотел бы создать новый...

user3476463 / 12 мая 2018
0 голосов
1 ответ

Я запускаю Spark в автономном режиме с каталогом Hive.Я пытаюсь загрузить данные из внешнего...

kirylm / 12 мая 2018
0 голосов
0 ответов

Я использую pyspark (Spark 2.1.1), чтобы вывести схему файла csv: sc.read.csv('/some/file

user3124181 / 11 мая 2018
0 голосов
3 ответов

Я работаю в среде pyspark с python3.6 в AWS Glue. У меня есть эта таблица: +----+-----+-----+-----+...

Andres Urrego Angel / 11 мая 2018
0 голосов
3 ответов

У меня есть два искровых фрейма данных: Фрейм данных A: |col_1 | col_2 | ... | col_n | |val_1 |...

djWann / 11 мая 2018
0 голосов
0 ответов

Среда: Python 3.6 pyspark glue aws Я определил список с каждым именем DF, которое я создал ранее

Andres Urrego Angel / 11 мая 2018
0 голосов
0 ответов

Я работаю в PySpark, используя Spark 2.1, чтобы подготовить свои данные для построения...

Amber Z. / 11 мая 2018
0 голосов
1 ответ

Я хочу применить функцию кодирования меток sklearn.preprocessing для потоковой передачи данных с...

Khan Hafizur Rahman / 11 мая 2018
0 голосов
2 ответов

Мой скрипт pyspark - m.py, он содержит l = [1,2,3,4,7,5,6,7,8,9,0] k = sc.parallelize(l) type(k)...

Karan Sawlani / 11 мая 2018
0 голосов
1 ответ

Я использую следующую функцию, чтобы получить процентили из двух столбцов «Яблоко» и «Апельсины»

Sun / 11 мая 2018
0 голосов
1 ответ

Я изменил сгенерированный Glue скрипт, который я использую для преобразования и манипулирования...

Toshe / 11 мая 2018
0 голосов
1 ответ

У меня была проблема, которая представляет собой программу for loop. Как показано ниже: list = [1,2...

Zhang Xin / 11 мая 2018
0 голосов
0 ответов

У меня есть кадр данных df1 со столбцом col1, который имеет структуру:...

Vikas J / 10 мая 2018
0 голосов
0 ответов

Мы используем версию сообщества CDH 5.8.3 и хотим добавить поддержку Python 3.5+ в наш кластер Я...

Rohan / 10 мая 2018
0 голосов
1 ответ

Нужна помощь в выяснении, как это закодировать.У меня есть 2 фильтра, которые нужно проверить в...

Deepa / 10 мая 2018
0 голосов
1 ответ

Я пытаюсь извлечь некоторые данные из эластичного поиска с помощью pyspark. Я хочу извлечь только...

amol_shaligram / 10 мая 2018
0 голосов
1 ответ

Я получаю логи в формате log4j, обрабатываю их и сохраняю в Spark. Я не в кластерной или...

kumar / 10 мая 2018
0 голосов
1 ответ

Я пытаюсь определить часовой пояс в PySpark, учитывая долготу и широту события. Я наткнулся на...

tmrlvi / 10 мая 2018
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...