Вопросы с тегом pyspark - PullRequest

Вопросы с тегом pyspark

1 голос
1 ответ

Я пытаюсь отфильтровать большой RDD на основе широковещательной переменной. Я смог сделать...

DataTx / 22 апреля 2019
1 голос
1 ответ

У меня есть СДР, верхние 2 элемента которого указаны выше: dataset_json = sc

M_Idk392845 / 22 апреля 2019
0 голосов
0 ответов

Я пытаюсь работать с некоторыми довольно широкими файлами (более 860 столбцов), которые создаются...

jg_w / 22 апреля 2019
0 голосов
0 ответов

как настроить память PySpark так, чтобы она не превышала заданный лимит?--executor-memory 2g

Saifullah / 22 апреля 2019
0 голосов
1 ответ

У меня есть rdd, каждая строка которого содержит три типа данных.Например, from pyspark.sql import...

giser_yugang / 22 апреля 2019
0 голосов
1 ответ

У меня есть фрейм данных Pyspark x1 x2 12 4 8 5 13 2 Я хотел бы ограничить x1 = 10 для строк с x2...

mommomonthewind / 22 апреля 2019
0 голосов
0 ответов

Я новичок в использовании Spark для приложений с большими данными.Почему-то кажется, что pyspark не...

joshua clark / 22 апреля 2019
0 голосов
0 ответов

Как напечатать значение на каждой итерации в PairRDD, чтобы увидеть, как оно работает? x = sc

Karthikeyan Rasipalayam Durai / 22 апреля 2019
0 голосов
1 ответ

Я хотел бы знать, возможно ли использование pyspark, если я могу рассчитать разницу во времени...

MaBe Moreira / 22 апреля 2019
1 голос
1 ответ

У меня есть искровой фрейм данных в pyspark, и мне нужно удалить все константные столбцы из моего...

kanimbla / 21 апреля 2019
0 голосов
1 ответ

Я использовал подстроку, чтобы получить первое и последнее значение.Но как я могу найти...

Katelyn Raphael / 21 апреля 2019
0 голосов
1 ответ

Рассмотрим пример кадра данных: df = +-------+-----+ | tech|state| +-------+-----+ | 70|wa | |...

TJE / 21 апреля 2019
0 голосов
0 ответов
0 голосов
0 ответов

Я хочу добавить новый столбец с некоторым выражением, как здесь определено (https://www.mien

Aviral Srivastava / 21 апреля 2019
0 голосов
1 ответ

Я использую блоки данных в Azure для выполнения некоторых задач машинного обучения и пытаюсь...

justin.cherveny / 21 апреля 2019
1 голос
0 ответов

Может ли кто-нибудь помочь мне с тем, как реализовать умножение матрицы на вектор в методе...

sjrk / 21 апреля 2019
1 голос
3 ответов
0 голосов
1 ответ

Pyspark установлен на моем Mac. Эта ошибка появляется при попытке запустить Pyspark из командной...

vinaykp / 21 апреля 2019
1 голос
1 ответ

Я преобразую несколько строковых столбцов в столбцы даты и времени, но сталкиваюсь со следующими...

Rob / 21 апреля 2019
1 голос
1 ответ

В Windows, когда я запускаю свою оболочку pyspark, я получаю сообщение об ошибке: 2019-04-20...

maverick / 20 апреля 2019
1 голос
0 ответов

Я загружаю модель машинного обучения в память в Spark и использую ее для классификации потоковых...

Adrian Negru / 20 апреля 2019
1 голос
2 ответов

Ниже мой Spark Dataframe. Я хочу сделать интерполяцию и написать для этого Spark UDF. Я не уверен,...

nithin / 20 апреля 2019
0 голосов
0 ответов

Вот в чем проблема: я написал модуль на python, который принимает RDD spark (spark 2.4) через...

Bryce Tutt / 20 апреля 2019
2 голосов
1 ответ

Я пытаюсь определить порядок типов партий на основе порядка их поступления. Я начинаю с этого кадра...

ecoscape / 20 апреля 2019
0 голосов
1 ответ

У меня есть следующие преобразованные данные. dataframe: rev +--------+------------------+...

Munna / 19 апреля 2019
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...