Вопросы с тегом pyspark - PullRequest

Вопросы с тегом pyspark

0 голосов
0 ответов

PySpark - версия 2.4.0 Я пытаюсь уменьшить количество выходных слоев.К сожалению, не удалось...

kosi / 24 декабря 2018
0 голосов
2 ответов

Я не уверен, что я в правильной группе для этого вопроса.Любой я создал следующий код sql в...

Carltonp / 23 декабря 2018
0 голосов
1 ответ

Я создал 2 кадра данных, как показано ниже: df_flights = spark1.read

Dan Siegel / 23 декабря 2018
0 голосов
2 ответов

Например, набор данных, это файл csv- Name , Country, Income Alan Turing, UK, 1000 James Clark, US,...

Phoenix14 / 23 декабря 2018
0 голосов
0 ответов

Я пытаюсь установить zeppelin в моей системе.Я установил java 8 spark 2.3 и hadoop 2.7 на свои окна...

Paramesh / 22 декабря 2018
0 голосов
1 ответ

У меня серьезные проблемы.Я хочу вычислить отношение десяти миллионов записей, но обработка...

tatsuya.takahashi / 22 декабря 2018
0 голосов
0 ответов

Я надеюсь, что вы можете помочь! Я сделал следующее для преобразования SQL в код PySpark.Все это...

kikee1222 / 22 декабря 2018
0 голосов
0 ответов

Я могу подключиться к Spark 2.4 в Kubernetes.Вот мой код ниже для конфигурации: conf

Alok Gogate / 22 декабря 2018
0 голосов
2 ответов

Я хотел бы заменить несколько строк в pyspark rdd.Я хотел бы заменить эти строки в порядке длины -...

James / 22 декабря 2018
0 голосов
1 ответ

Я хочу использовать этот синтаксис: sc.textFile (','. Join (files)) Однако мне также нужно...

EVS / 22 декабря 2018
0 голосов
0 ответов

Я должен определить, как меняются данные.У меня есть таблица улья с 60 столбцами, включая столбец...

Raji / 21 декабря 2018
0 голосов
0 ответов

Кто-нибудь может увидеть, что с этим не так:? from pyspark.sql.functions import countDistinct,...

Stanislav Jirak / 21 декабря 2018
0 голосов
1 ответ

У меня есть программа pyspark, которая успешно подключается к базе данных MySQL и читает таблицу

kanchan tewary / 21 декабря 2018
0 голосов
3 ответов

У меня есть фрейм данных (df) , а внутри фрейма данных у меня есть столбец user_id df = sc

Data_101 / 21 декабря 2018
0 голосов
0 ответов

Я пытаюсь вычислить контрольную сумму двоичного файла в pyspark.Я не уверен, правильный ли код или...

megha raina / 21 декабря 2018
0 голосов
2 ответов

У меня есть фрейм данных с дублирующимися строками, и я хотел бы объединить их в одну запись со...

Yuva / 21 декабря 2018
0 голосов
1 ответ

Я хочу применить алгоритм случайного леса к фрейму данных, состоящему из трех столбцов, а именно...

Dipawesh Pawar / 21 декабря 2018
0 голосов
1 ответ

У меня есть фрейм данных pyspark, который выглядит следующим образом: col1 | col2 | col3 R a abc R...

kamal bharadwaj / 20 декабря 2018
0 голосов
1 ответ

У меня есть датафрейм dns (строка) и ip-адрес (строка).Я хотел бы использовать UDF для применения...

samuel oyeleye / 20 декабря 2018
0 голосов
2 ответов

Я использую spark на python, итеративно запускаю команду pyspark из Терминала, а также запускаю...

Francesco Boi / 20 декабря 2018
0 голосов
3 ответов

У меня есть 2 кадра данных, которые мне нужно объединить на основе столбца (код сотрудника)

Yuva / 20 декабря 2018
0 голосов
1 ответ

Я пытаюсь сравнить две очень большие записи CSV по записи, и мне нужно сгенерировать сводную...

user2827230 / 20 декабря 2018
0 голосов
2 ответов

У меня есть архитектура с 4 узлами и RDD с 4000 строками, и мне необходимо равномерно распределить...

Giulia / 20 декабря 2018
0 голосов
0 ответов

Я использую логистическую регрессию PySpark, пытаясь отсортировать коэффициенты, чтобы я мог...

sparkly / 20 декабря 2018
0 голосов
2 ответов

У меня есть код / ​​приложение PySpark.Каков наилучший способ его запустить (использовать...

lU5er / 20 декабря 2018
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...