Вопросы с тегом pyspark - PullRequest

Вопросы с тегом pyspark

0 голосов
0 ответов

Запуск задания потоковой передачи искры на узле, но получение сбоя? пробовал другую версию kafka, и...

tech tipsi / 17 июня 2019
0 голосов
1 ответ

У меня есть фрейм данных pyspark, который .show () указывает, что все нормально, но .toPandas (),

user1624577 / 17 июня 2019
1 голос
1 ответ

Я только начал работать в Pyspark, и мне нужна помощь в преобразовании типа столбца.В моем фрейме...

bchain / 17 июня 2019
1 голос
0 ответов

Вот мой код, в котором я пытаюсь создать новый фрейм данных из набора результатов моего левого...

Shanmukha / 17 июня 2019
0 голосов
0 ответов

Я обучил модель на python с использованием Наивного Байеса, но я не могу сохранить модель в любой...

fantaStick / 16 июня 2019
1 голос
0 ответов

Я хотел бы знать, можем ли мы, используя PySpark, получить ошибки, полученные во время K-fold cv,...

Simone / 16 июня 2019
0 голосов
0 ответов

Я хочу присоединиться к 2 df от pyspark, и там довольно много столбцов.Всякий раз, когда я пытаюсь...

Roy / 16 июня 2019
0 голосов
1 ответ

Я пытаюсь прочитать файл avro в блокноте Jupyter с помощью pyspark.Когда я читаю файл, я получаю...

Conz / 16 июня 2019
1 голос
3 ответов

У меня есть СДР с большим количеством записей KeyVal. Один и тот же ключ будет присутствовать...

AstroAT / 16 июня 2019
0 голосов
1 ответ

У меня есть столбец метки времени в виде строки.Я хотел бы преобразовать их в дату в формате...

zyzz wezz / 16 июня 2019
0 голосов
0 ответов

Я пытаюсь подключиться к своим корзинам s3, используя мой Spark, следующим образом: rdd=sc

Mosali HarshaVardhan Reddy / 16 июня 2019
1 голос
1 ответ

Я пытаюсь запустить скрипт в PySpark, используя Dataproc. Этот скрипт является своего рода...

D Andreea / 15 июня 2019
2 голосов
1 ответ

У меня есть такой фрейм данных:...

Rado / 15 июня 2019
0 голосов
0 ответов
0 голосов
0 ответов

Я запускаю искровое задание в режиме кластера пряжи и не могу сохранить журналы в файле.Я использую...

Deepak Sharma / 15 июня 2019
0 голосов
0 ответов

Я работаю с spark 2.4.0 и python 3.6.Я занимаюсь разработкой программы на python со...

Roberto Patrizi / 15 июня 2019
0 голосов
1 ответ

Для некоторого фона я пытаюсь сопоставить строки в одном кадре данных (df1) с аналогичными строками...

Daniel Bishop / 15 июня 2019
0 голосов
0 ответов

Я пытаюсь загрузить данные в таблицу, используя df.write.format(HIVE_WAREHOUSE_CONNECTOR)

Sridhar / 14 июня 2019
0 голосов
2 ответов

Я хотел бы ускорить выполнение множества задач при выполнении моих расчетов, но при записи в...

Gopal / 14 июня 2019
0 голосов
0 ответов

Что ж, у меня проблема с rangeBetween, я не знаю, как добраться до скользящей средней. это моя...

Rhoufrane Ismaili / 14 июня 2019
0 голосов
1 ответ

У меня есть файл паркета /df, сохраненный в формате hdf с 120 разделами.Размер каждого раздела в...

Clay / 14 июня 2019
0 голосов
0 ответов

Мы хотим использовать структурированную потоковую передачу Spark для обработки данных, которые...

spark-user / 14 июня 2019
0 голосов
0 ответов

Я использую следующее в Windows 10. -spark-2.3.1-бен-hadoop2.7 -jdk1.8.0_211 Переменные окружения...

user3364545 / 14 июня 2019
0 голосов
0 ответов

У меня есть SparkContext sc с сильно настроенным SparkConf ().Как мне использовать этот...

jamiet / 14 июня 2019
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...