Вопросы с тегом pyspark - PullRequest

Вопросы с тегом pyspark

0 голосов
1 ответ

У меня есть два фрейма данных в PySpark: df1 +---+-----------------+ |id1| items1|...

carpediem / 22 октября 2018
0 голосов
0 ответов

В целом: наш код получает данные из Snowflake (= хранилище данных), выполняет определенные...

Marjolein / 22 октября 2018
0 голосов
1 ответ

Справочная информация. Чтобы позволить разработчикам создавать и тестировать код в удобной среде,...

b.chath / 22 октября 2018
0 голосов
0 ответов

Ошибка ниже при вставке записей в teradata из sparksql. py4j.protocol.Py4JJavaError: Произошла...

darla / 22 октября 2018
0 голосов
0 ответов

код, подобный этому, хочет использовать mlib / FPGrowth от pyspark, но имеет проблему из-за ошибки...

zhaowei / 22 октября 2018
0 голосов
1 ответ

У меня есть фрейм данных, в котором я пытаюсь добавить столбец, который в основном будет брать...

arnab_0017 / 22 октября 2018
0 голосов
1 ответ

У меня есть таблица из 50 тысяч различных строк и 2 столбцов.Можно представить, что каждая строка...

Ruby.L / 22 октября 2018
0 голосов
1 ответ

Я новичок в Spark и пытаюсь использовать pyspark (Spark 2.2) для выполнения операций фильтрации и...

Rishabh Sinha / 22 октября 2018
0 голосов
3 ответов

Я читаю CSV-файл в Spark, используя: df = spark.read.format (file_type) .options (header = 'true',...

user1761806 / 22 октября 2018
0 голосов
1 ответ

У меня есть список списков в RDD и список для пересечения.B необходимо взаимодействовать с каждым...

Saurabh / 21 октября 2018
0 голосов
2 ответов

У меня есть 2 кадра данных, например: DF1: Id | field_A | field_B | field_C | field_D 1 | cat | 12...

Beta / 21 октября 2018
0 голосов
1 ответ

При попытке создать поток из текстового файла в Pyspark появляется следующая ошибка: TypeError:...

Zeinab Akhavan / 21 октября 2018
0 голосов
1 ответ

У меня есть две таблицы RDD, часть и части. У них есть общий столбец joinKey.Я попытался объединить...

John Dough / 21 октября 2018
0 голосов
0 ответов
0 голосов
0 ответов

Я пытаюсь подключиться к базе данных Hive с проверкой подлинности Kerberos с помощью Pyspark в...

user3238848 / 21 октября 2018
0 голосов
1 ответ

Данные СДР, считанные из textFile (), состоящие из списка пар (str-key, [int-id, int-value])....

Vlo / 20 октября 2018
0 голосов
1 ответ

Я пытаюсь преобразовать некрасивый набор текстовых строк в репрезентативный фрейм данных PySpark.Я...

Renée / 20 октября 2018
0 голосов
1 ответ

Я только начал работать с Pyspark над новым приложением .. Я установил с помощью pip все...

Cyt0s / 20 октября 2018
0 голосов
1 ответ

запрос, который я использую: Я хочу заменить существующие столбцы новыми значениями при условии,...

Sandy / 20 октября 2018
0 голосов
2 ответов

У меня есть 2 пояснения к клею AWS, не могли бы вы уточнить.Поскольку мне нужно использовать клей...

RK. / 20 октября 2018
0 голосов
1 ответ

Моя цель - сохранить модель искры и затем сжать ее, но у меня возникли проблемы, потому что os

someguy / 20 октября 2018
0 голосов
1 ответ

Я пытаюсь найти определенную строку в файле и затем заменить ее другой конкретной строкой.Я...

Sarah Bratz / 19 октября 2018
0 голосов
1 ответ

Я хотел загрузить данные из хранилища BLOB-объектов Azure в базу данных SQL Azure, используя...

user3240372 / 19 октября 2018
0 голосов
0 ответов

Я пытаюсь загрузить модель xgboost в формате .dat в скрипт pyspark напрямую из HDFS. Я пытался...

Vladimir Sazonov / 19 октября 2018
0 голосов
3 ответов

У меня есть DataFrame df в PySpark, как показано ниже - +-----+--------------------+-------+ | ID|...

cph_sto / 19 октября 2018
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...