Вопросы с тегом pyspark - PullRequest

Вопросы с тегом pyspark

0 голосов
2 ответов

Я пытаюсь записать DataFrame в файл .csv: now = datetime.datetime.now() date = now

STORM / 12 октября 2018
0 голосов
2 ответов

Как добавить один или несколько столбцов в spark-sql? в oracle, мы делаем select name,...

Learn Hadoop / 12 октября 2018
0 голосов
0 ответов

Я пытаюсь запустить PySpark на своем компьютере, но моя программа неожиданно завершает работу и...

Michael Naples / 12 октября 2018
0 голосов
0 ответов

У меня есть информация о вине мерзавца.Я пытаюсь загрузить строки кода в rdd и запустить его через...

Michael Naples / 12 октября 2018
0 голосов
0 ответов

Я бы предположил, что .persist (StorageLevel.DISK_ONLY) освободит пространство процессора для...

Parity Bit / 12 октября 2018
0 голосов
1 ответ

У меня есть таблица улья с полем даты. +----------+------+-----+ |data_field| col1| col2|...

Bob / 12 октября 2018
0 голосов
0 ответов

Я попробовал .options ("orc.stripe.size", "25634344") на уровне модуля записи данных, но не дал...

John_Che / 12 октября 2018
0 голосов
0 ответов

У меня есть розничный набор данных в фрейме данных pyspark.sql со многими магазинами, и для каждого...

user9176398 / 12 октября 2018
0 голосов
1 ответ

Я перебираю несколько веб-сервисов, которые работают нормально customers= json

STORM / 11 октября 2018
0 голосов
1 ответ

У меня есть DataFrame (таблица) ниже, и я использую функцию суммы в столбцах _3 и _4. df.show()...

Himanshu Bajaj / 11 октября 2018
0 голосов
2 ответов

Я понимаю, как проверить существование таблицы в PySpark: >>> spark.catalog

Alex B / 11 октября 2018
0 голосов
1 ответ

Мне нужно написать условие if else в pyspark следующим образом. schema = StructType([]) final =...

jayesh / 11 октября 2018
0 голосов
1 ответ

Я строю модель перекрестной проверки на наборе данных.Объект перекрестной проверки имеет атрибуты...

merkle / 11 октября 2018
0 голосов
0 ответов

Пытался сгенерировать последовательность в Oracle для записей через чтение PySpark JDBC. from...

Joby / 11 октября 2018
0 голосов
1 ответ

У меня есть фрейм данных pyspark со столбцом MapType, и я хочу разбить его на все столбцы по имени...

Itachi / 11 октября 2018
0 голосов
2 ответов

Ниже приведены коды для создания 2 файлов из фреймов данных pyspark.Первый выполнен успешно.Вторая...

Shijo / 11 октября 2018
0 голосов
1 ответ

Я пытаюсь оценить несколько конвейеров в PySpark.Я могу сделать это в отдельном CV / TVS для...

sneaky_lobster / 11 октября 2018
0 голосов
2 ответов

Таблица Hive, созданная с помощью Spark (pyspark), недоступна из Hive. df.write

Shan / 11 октября 2018
0 голосов
1 ответ

Мой df имеет несколько столбцов Запрос, который я пытался: df=df

Sandy / 11 октября 2018
0 голосов
0 ответов

Я использую FPgrowth.train FROM pyspark.mllib.fpm для решения проблемы правил ассоциации и хотел бы...

alireSa Ranjbar / 11 октября 2018
0 голосов
0 ответов

Я использую следующий способ инициализации моего PySpark, и я использую Python3. # Initialize...

Ed1yang / 11 октября 2018
0 голосов
0 ответов

Я запускаю проблему регрессии, используя pyspark.Ниже мой код from pyspark.ml.classification import...

merkle / 11 октября 2018
0 голосов
0 ответов

Как проверить значения в функциях управления окнами в фреймах данных? Проблема: Найти строки в...

kaushikpasi / 11 октября 2018
0 голосов
2 ответов

У меня есть столбец с именем id, а данные выглядят так: + ---- + |id |+ ---- + |1 ||2 ||3 ||4 ||5...

subash poudel / 11 октября 2018
0 голосов
0 ответов

direct_kafka_stream = KafkaUtils.createDirectStream( ssc=ssc, topics=['pdns'],...

Longfei Dong / 11 октября 2018
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...