Вопросы с тегом pyspark-SQL - PullRequest

Вопросы с тегом pyspark-SQL

0 голосов
1 ответ

У меня есть пример таблицы, как показано ниже (у меня есть 1 миллион таких строк), из этого мне...

user3607698 / 01 сентября 2018
0 голосов
1 ответ

Я хочу преобразовать приведенный ниже код панды в pysaprk. d =...

Mithril / 31 августа 2018
0 голосов
0 ответов

Кажется, что все эти функции выполняют довольно похожие операции. OneHotEncoderEstimator в...

Keshinko / 30 августа 2018
0 голосов
2 ответов

Я хочу, чтобы значение пересечения 2 данных (столбцов) совпадало с unique_ID, и сохраняло значение...

Shail / 30 августа 2018
0 голосов
1 ответ

Я не могу найти сумму СДР. Я новичок в этой области, пожалуйста, помогите. Использование Python 2.7...

Aryan Soni / 30 августа 2018
0 голосов
1 ответ

У меня есть PySpark DataFrame со столбцами people и timestamp (плюс дополнительные столбцы, которые...

RaspyVotan / 29 августа 2018
0 голосов
1 ответ

в запросе, чтобы выбрать некоторые столбцы из кадра данных, у меня есть тип столбца: карта, которая...

Amine H / 29 августа 2018
0 голосов
1 ответ

Я хочу использовать collect_list в: from pyspark.sql.functions import collect_list Но пакет функций...

Gene Guo / 28 августа 2018
0 голосов
1 ответ

Мне нужно прочитать строку файла, разделить каждую строку на слова и выполнить операции со словами....

adev / 28 августа 2018
0 голосов
1 ответ

У меня проблемы с использованием Spark 2.3.1 и PySpark. Firstable Я пытался выполнить все множество...

Alternative intelligence / 27 августа 2018
0 голосов
1 ответ

У меня есть искровой DataFrame, импортированный из файла CSV. После применения некоторых...

RaspyVotan / 27 августа 2018
0 голосов
0 ответов

У меня есть CSV-файл, разделенный запятыми. Используя PySpark, я хочу загрузить некоторые поля в...

Percy K / 27 августа 2018
0 голосов
0 ответов

Я могу запустить следующий код и получить включенные выходные данные, но он не работает, если один...

Abraham / 25 августа 2018
0 голосов
1 ответ

Я использую годовой доход взрослого населения от UCI. У меня есть фрейм данных с категориальной...

sneaky_lobster / 25 августа 2018
0 голосов
1 ответ

У меня есть фрейм данных, в котором много столбцов (более 50 столбцов), и я хочу выбрать все...

prasannads / 25 августа 2018
0 голосов
1 ответ

У меня есть два кадра данных, DF1 и DF2, DF1 является ведущим, а DF2 является дельтой. Данные из...

navin / 24 августа 2018
0 голосов
1 ответ

Получение ошибки при вызове кода ниже. Это взрыв массива в кадре данных без потери нулевых значений...

VermaAbhishek / 05 июля 2018
0 голосов
0 ответов

Я пытаюсь подсчитать, сколько раз поле «мера» имеет значение «М» между датой 1 и датой 2 для каждой...

alejandro pareja / 05 июля 2018
0 голосов
1 ответ

В Spark 2.1 с использованием pyspark, если вы хотите запросить таблицу (например, из HDP), вы...

Micah Pearce / 03 июля 2018
0 голосов
1 ответ

Я следовал этим инструкциям и установил Apache Spark (PySpark) 2.3.1 на мою машину со...

Wesam / 03 июля 2018
0 голосов
0 ответов

У меня есть столбец даты в метке времени Unix следующим образом: %sql select timestamp from table...

Atihska / 03 июля 2018
0 голосов
1 ответ

Рассмотрим следующий фрейм данных: #+------+---+ #|letter|rpt| #+------+---+ #| X| 3| #| Y| 1| #|...

pault / 02 июля 2018
0 голосов
2 ответов

Я пытаюсь получить тип данных столбца из кадра данных Вот пример кода: print training_data.schema...

Pratap D / 02 июля 2018
0 голосов
2 ответов

Я хотел бы реплицировать все строки в моем DataFrame на основе значения данного столбца в каждой...

LuizF Gonçalves / 29 июня 2018
0 голосов
1 ответ

Цель моего кода - пытаться отбрасывать столбец каждый раз, когда он появляется. Я знаю, что есть...

Jay / 29 июня 2018
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...