Вопросы с тегом pyspark - PullRequest

Вопросы с тегом pyspark

0 голосов
0 ответов

В моих данных есть выбросы, которые я не хочу удалять.Итак, я заменяю их 5-процентным и...

smruthi kilari / 20 ноября 2018
0 голосов
1 ответ

Я пытаюсь найти минимум, максимум каждого поля, полученного из оператора sql, и записать его в файл...

Shankar Panda / 20 ноября 2018
0 голосов
0 ответов

В R мы можем стандартизировать фрейм данных с помощью функции масштабирования dfNormZ <- as.data

smruthi kilari / 20 ноября 2018
0 голосов
2 ответов

Я пытаюсь отправить результат sql в цикл for.Я новичок в Spark и Python, пожалуйста, помогите. from...

Shankar Panda / 20 ноября 2018
0 голосов
0 ответов

Возникла проблема при чтении файла test2.csv в pyspark. Тестовый файл test1.csv a1^b1^c1^d1^e1...

user10678179 / 20 ноября 2018
0 голосов
0 ответов

Я хочу установить pyspark-cassandra, чтобы я мог запускать искровой запрос к базе данных cassandra...

Carol / 20 ноября 2018
0 голосов
0 ответов

Я хочу разделить свой фрейм данных объемом 1 ТБ на множество фреймов данных после фильтрации и хочу...

LK Tyagi / 20 ноября 2018
0 голосов
1 ответ

Впервые в PySpark и AWS Glue.Мне нужно получить имена полей и типы данных, чтобы использовать их в...

Siva Budati / 20 ноября 2018
0 голосов
1 ответ

Мой фрейм данных выглядит следующим образом. У меня есть фрейм данных pyspark, и я хочу разделить...

Emma / 20 ноября 2018
0 голосов
1 ответ

При попытке создать DataFrame с помощью Spark SQL, передав ему список строк, например, так:...

user976850 / 20 ноября 2018
0 голосов
2 ответов

Я хотел бы разделить СДР по ключу и иметь, чтобы каждый раздел содержал только значения одного...

alexlipa / 20 ноября 2018
0 голосов
0 ответов

У меня есть небольшая работа Spark, которая собирает файлы из s3, группирует их по ключу и...

alon_r / 20 ноября 2018
0 голосов
0 ответов

Pyspark: Можно ли установить / изменить длину столбца кадра данных искры при записи DF в целевой...

Lucky / 19 ноября 2018
0 голосов
0 ответов

Я создал кластер EMR, в котором есть один главный и один подчиненный узлы. В настоящее время,...

Raj / 19 ноября 2018
0 голосов
1 ответ

У меня есть CSV-файл со следующей структурой USER_ID location timestamp 1 1001 19:11:39 5-2-2010 1...

imed eddines / 19 ноября 2018
0 голосов
1 ответ

Я использую PySpark Python3 - Spark 2.1.0, и у меня есть список списков различий, таких как:...

HELENA PALENZUELA RODRIGUEZ / 19 ноября 2018
0 голосов
2 ответов

Запуск нескольких файлов CSV, и я пытаюсь запустить и сделать некоторые проверки, и по какой-то...

ziedTn / 19 ноября 2018
0 голосов
0 ответов

в базе данных эластичного поиска У меня есть эти данные: { "titre": "Formation...

Vianney Bailleux / 19 ноября 2018
0 голосов
1 ответ

Я вручную скопировал spark-2.4.0-bin-hadoop2.7.tgz и извлек.Затем я сделал запись в .bash_profile,...

suman kalyan / 19 ноября 2018
0 голосов
2 ответов

Я пытаюсь установить Spark Release 2.4.0 на мой компьютер, система которого win7_x64. Однако, когда...

Jason / 19 ноября 2018
0 голосов
1 ответ

Привет У меня следующий rdd: Заголовок: id | категория | дата | имя | возраст содержимое rdd...

Avinash Clinton / 19 ноября 2018
0 голосов
1 ответ

Я построил модель машинного обучения, основанную на кластеризации, и теперь просто хочу...

bioinformatician / 19 ноября 2018
0 голосов
2 ответов

Вероятно, это глупый вопрос, возникший из-за моего невежества.Я работаю над PySpark уже несколько...

AntonyP / 19 ноября 2018
0 голосов
1 ответ

Я использую spark 2.3 и написал один фрейм данных для создания многораздельной таблицы улья,...

vikrant rana / 19 ноября 2018
0 голосов
0 ответов

Я только что начал с pySpark, и я пытаюсь найти количество слов для каждого алфавита из текстового...

Sree / 19 ноября 2018
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...