Вопросы с тегом pyspark - PullRequest

Вопросы с тегом pyspark

0 голосов
1 ответ

У меня есть PySpark DataFrame, df1, который выглядит следующим образом: CustomerID CustomerValue...

Nektaria.M / 27 сентября 2018
0 голосов
0 ответов

У меня есть настройка кластера pyspark на ubuntu 16.xxx, и я пытаюсь обновить свою версию pyspark с...

flyingmeatball / 27 сентября 2018
0 голосов
0 ответов

Когда я использую .describe () с использованием Pyspark, это приводит к Py4JJavaError, где, как я...

Harsha / 27 сентября 2018
0 голосов
3 ответов

Если у меня есть фрейм данных, созданный следующим образом: df = spark.table("tblName")...

Subramaniam Ramasubramanian / 27 сентября 2018
0 голосов
2 ответов

Используя pyspark, я обновляю таблицу mysql, схема имеет ограничение уникального ключа для...

Raghav salotra / 27 сентября 2018
0 голосов
0 ответов

У меня есть 3 таблицы в базе данных abc hive в формате Avro.Я хочу создать другую базу данных (def)...

RRRR / 27 сентября 2018
0 голосов
0 ответов

Я разрабатывал функцию линейной регрессии в pyspark и проверял точность с помощью перекрестной...

Lenin S / 27 сентября 2018
0 голосов
0 ответов

У меня есть задания pyspark, а также некоторые скрипты python для предварительной обработки наборов...

Spark Scala Developer / 27 сентября 2018
0 голосов
1 ответ

Я хочу создать новую таблицу hbase, если она не существует в пространстве имен / hbase из кода...

PRATHAMESH / 27 сентября 2018
0 голосов
0 ответов

У меня есть словарь, где параметры в строковом формате. hyperparameters= { "random_seed":...

merkle / 27 сентября 2018
0 голосов
2 ответов

Я смотрю на функцию слайда окна для Spark DataFrame в Spark SQL. У меня есть кадр данных со...

misoji / 27 сентября 2018
0 голосов
1 ответ

Я новичок в scala - spark и загрузил мой набор данных в RDD.Вот мой пример набора данных scala>...

Learn Hadoop / 27 сентября 2018
0 голосов
1 ответ

Я новичок в искре.Я пытался взорвать array внутри struct.Цикл JSON немного сложен, как показано...

ZZzzZZzz / 27 сентября 2018
0 голосов
0 ответов

Я пытаюсь преобразовать функцию pandas "dot matrix nansum" в pyspark .Цель состоит в том, чтобы...

Dan Grossnickle / 27 сентября 2018
0 голосов
1 ответ

Я пытаюсь добиться этой функциональности , используя SPARK-SQL, используя оболочку pyspark. Я...

cheapcoder / 27 сентября 2018
0 голосов
1 ответ

Сначала я загрузил данные по: import urllib.request f = urllib.request

BlueBit / 26 сентября 2018
0 голосов
1 ответ

Я пытаюсь создать новый столбец в кадре данных на основе значений некоторых столбцов.Это возвращает...

flyingmeatball / 26 сентября 2018
0 голосов
1 ответ

Попытка сохранить искровой фрейм данных (python) в формате .tde.Будет ли работать включение этих...

Subhashini Balu / 26 сентября 2018
0 голосов
1 ответ

Я хочу использовать pySpark для реструктуризации своих данных, чтобы я мог использовать их для...

Vidster / 26 сентября 2018
0 голосов
2 ответов

Я знаю, что это, возможно, задавали и раньше, но я спрашиваю об этом, потому что я не уверен,...

Atif / 26 сентября 2018
0 голосов
2 ответов

Я пытаюсь работать с большим набором данных, но просто поиграть с небольшой его частью.Каждая...

eran / 26 сентября 2018
0 голосов
1 ответ

У меня есть PySpark Dataframe с двумя столбцами (A, B, тип которых double), значения которых 0.0...

eran / 26 сентября 2018
0 голосов
0 ответов

Я пытаюсь построить Матрицу корреляции Однако, когда я проверяю результаты, они не совпадают....

user 923227 / 26 сентября 2018
0 голосов
0 ответов

Я знаю, что широковещательная переменная имеет ограничение 2G, и не рекомендуется транслировать...

momo / 25 сентября 2018
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...