Вопросы с тегом pyspark - PullRequest

Вопросы с тегом pyspark

0 голосов
3 ответов

Можно ли считать файл ORC похожим на файл CSV с заголовками столбцов и метками строк, содержащими...

Della / 19 октября 2018
0 голосов
0 ответов

Мне удалось написать небольшой скрипт, использующий PySpark для извлечения и организации данных из...

Wilson / 19 октября 2018
0 голосов
1 ответ

У меня есть вектор nparray с 0 и 1 с 37k строками и 6k столбцами.Когда я пытаюсь запустить Kmeans...

Nisarg Kapadia / 19 октября 2018
0 голосов
1 ответ

У меня есть сжатый zip csv, хранящийся на S3.Я хотел бы преобразовать этот файл в формат паркета,...

user2752159 / 18 октября 2018
0 голосов
1 ответ

У меня есть список со строками в качестве его элементов. list_elem = ['df1.x1 == df2.p1',...

jayesh / 18 октября 2018
0 голосов
1 ответ
0 голосов
1 ответ

Я динамически генерирую строку запроса следующим образом и передаю ее в selectExpr ()....

sanjeev kumar / 18 октября 2018
0 голосов
3 ответов

У меня есть список значений в столбце в DataFrame, который я хочу использовать для фильтрации...

Taylrl / 18 октября 2018
0 голосов
1 ответ

Я использую pyspark для анализа большого количества данных.У меня есть кадр данных, который имеет...

Hassan Jalil / 18 октября 2018
0 голосов
0 ответов

Я сталкиваюсь с ситуацией, когда я получаю разные объяснения, объясняет планы для одной и той же...

Subramaniam Ramasubramanian / 18 октября 2018
0 голосов
4 ответов

Я пытаюсь прочитать локальный файл в режиме клиента на платформе Yarn.Мне также не удалось получить...

vikrant rana / 18 октября 2018
0 голосов
2 ответов

Я пытаюсь создать новый столбец, добавив два существующих столбца в моем фрейме данных. Исходный...

Mr.P / 18 октября 2018
0 голосов
1 ответ

Итак, я хочу посчитать количество нулей в кадре данных по строке. Обратите внимание, что существует...

tormond / 18 октября 2018
0 голосов
0 ответов

Проблема: в настоящее время я пытаюсь прочитать текстовый файл с данными Json.Целью этого является...

user3198708 / 18 октября 2018
0 голосов
1 ответ

У меня есть фрейм данных с двумя столбцами, который выглядит следующим образом: +----+-----+...

ahajib / 17 октября 2018
0 голосов
1 ответ

У меня есть фрейм данных, как показано ниже. --------------------+ | pas1| +--------------------+...

darla / 17 октября 2018
0 голосов
1 ответ

У меня есть данные, как пример данных ниже.Я пытаюсь создать новый столбец в моих данных, используя...

user3476463 / 17 октября 2018
0 голосов
1 ответ

У меня есть искровой фрейм данных, состоящий из> 1200 столбцов, и мне нужно взять среднее число...

pceccon / 17 октября 2018
0 голосов
0 ответов

for elem in list: final = sqlCtx.read.table('XXX.YYY') interim = final.join(elem...

jayesh / 17 октября 2018
0 голосов
1 ответ

У меня есть два набора данных.так как я могу объединить эти наборы данных df.show()...

Himanshu Bajaj / 17 октября 2018
0 голосов
3 ответов

Как создать кадр данных для столбцов, разделенных пробелами? DataType yyyy mm tmax tmin af rain sun...

Himanshu Bajaj / 17 октября 2018
0 голосов
1 ответ

У меня есть два кадра данных. AA = +---+----+---+-----+-----+ | id1|id2| nr|cell1|cell2|...

Qubix / 17 октября 2018
0 голосов
2 ответов

Мои данные показывают пару слов и количество раз, сколько эта пара встречается.Например:...

vivi11130704 / 17 октября 2018
0 голосов
1 ответ

Можно ли динамически фильтровать кадры данных? Например, если у меня есть приведенный ниже словарь...

user1 / 17 октября 2018
0 голосов
2 ответов

Есть ли способ получить точки на кривой ROC от Spark ML в pyspark?В документации я вижу пример для...

seth127 / 17 октября 2018
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...