Вопросы с тегом pyspark - PullRequest

Вопросы с тегом pyspark

0 голосов
1 ответ

Я хочу рассчитать возраст и из поля DOB. Но в моем коде я тяжело его кодирую. Но нужно делать...

Pallavi Verma / 04 октября 2019
0 голосов
1 ответ

Попытка реализовать алгоритм регрессора дерева решений для некоторых обучающих данных, но когда я...

wookieluvr13 / 04 октября 2019
1 голос
0 ответов

В настоящее время я построил модель BucketedRandomProjectionLSH, чтобы вычислить сходство данных по...

Louis Luk / 04 октября 2019
0 голосов
1 ответ

Я пытаюсь использовать k-кратную перекрестную проверку для настройки регрессивного дерева,...

wookieluvr13 / 04 октября 2019
3 голосов
1 ответ

У меня есть следующая папка с секционированными данными - my_folder |--part-0000.gzip |--part-0001

kev / 04 октября 2019
3 голосов
1 ответ

У меня есть программа Spark, которая запускается локально на моей машине с Windows. Я использую...

Alon / 04 октября 2019
0 голосов
0 ответов

Надеясь, что кто-то может помочь пролить свет на это. Я читаю 35Gb .csv с S3. Я ожидал, что он...

nciao / 04 октября 2019
0 голосов
1 ответ

В настоящее время я выгружаю данные из таблицы улья в текстовый файл, используя hql. Так как это...

Beggie / 03 октября 2019
1 голос
0 ответов

Я новичок в Spark и только начал его использовать. Попытка импортировать SparkSession из pyspark,...

Chique_Code / 03 октября 2019
0 голосов
0 ответов

У меня есть обученная модель keras. https://github.com/qubvel/efficientnet У меня большой...

koren maliniak / 03 октября 2019
0 голосов
0 ответов

Я пытаюсь загрузить файл с меткой времени в мою таблицу кустов, сохранив фрейм данных в путь hdfs....

James Davinport / 03 октября 2019
0 голосов
1 ответ

Я хотел бы сделать вычисления для получения 5 лучших ключевых слов в каждой стране и внутри метода,...

Sidi Chang / 03 октября 2019
2 голосов
0 ответов
0 голосов
0 ответов

Предположим, у меня есть следующие два набора данных. Я пытаюсь связать продукты под рукой с их...

Shawn / 03 октября 2019
0 голосов
2 ответов

Я пытаюсь создать zip-файл из нескольких файлов. Например, у меня есть 3 файла file1 file2 file3 Я...

Minchu / 03 октября 2019
0 голосов
0 ответов

Я сталкиваюсь с тем, что, я думаю, является основной проблемой, но мне на удивление трудно найти...

Jay Cee / 03 октября 2019
2 голосов
2 ответов

Я строю простой сетевой график с PySpark и GraphFrames (работает на Google Dataproc) vertices =...

Alex / 03 октября 2019
0 голосов
1 ответ

У меня есть pyspark.sql.dataframe.DataFrame с 1300 строками и 5 столбцами. Я использую следующее...

ecp / 03 октября 2019
0 голосов
2 ответов

Я новичок в разжигании и не имею опыта программирования на Java. Я использую pyspark для обработки...

varun / 03 октября 2019
0 голосов
0 ответов

при отправке искрового задания в автономном режиме оно сразу же завершает работу, сообщая об ошибке...

adarsh2109 / 03 октября 2019
0 голосов
0 ответов

Я конвертирую большой CSV-файл в файл Parquet (pyspark), пока он выглядит хорошо, пока число строк...

syv / 03 октября 2019
1 голос
0 ответов

Как я могу объединить или объединить статический фрейм данных только с одной строкой в ​​потоковый...

Hoda.bdz / 03 октября 2019
4 голосов
1 ответ

У меня есть следующий набор данных: id email Date_of_purchase time_of_purchase 1 abc@gmail.com...

user3642360 / 03 октября 2019
0 голосов
1 ответ

У меня есть dataframe только из одного столбца. Я хотел бы разбить строку, используя pandas_udf в...

I. A / 03 октября 2019
0 голосов
1 ответ

Извините, если это просто, и я упустил что-то простое. Я пытаюсь запустить приведенный ниже код,...

asher / 03 октября 2019
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...