Вопросы с тегом pyspark-SQL - PullRequest

Вопросы с тегом pyspark-SQL

0 голосов
1 ответ

У меня есть 4 текстовых файла. 2 файла содержат данные таблиц базы данных, а другие 2 содержат...

Sai / 09 октября 2018
0 голосов
1 ответ

Я пытаюсь выполнить групповое среднее значение для фрейма данных pyspark, используя функцию...

Bharat Sharma / 09 октября 2018
0 голосов
1 ответ

Я пытаюсь в pyspark получить новый столбец, округляя один столбец таблицы с точностью, указанной в...

JOSE MANUEL RAMIREZ LEON / 08 октября 2018
0 голосов
1 ответ

Я работаю над Spark 2.3, Python 3.6 с pyspark 2.3.1 У меня есть Spark DataFrame, где каждая запись...

RaspyVotan / 08 октября 2018
0 голосов
0 ответов

Я в основном заменяю другого программиста. Описание проблемы : существует 11 таблиц кустов, каждая...

ever-learner / 07 октября 2018
0 голосов
1 ответ

У меня есть два dataframe-df1 и df2.df1 состоит из 70 строк и 7 столбцов, а df2 состоит из 80 строк...

andy / 06 октября 2018
0 голосов
3 ответов

Как показано в приведенном ниже коде, я считываю файл JSON в фрейм данных и затем выбираю некоторые...

AntonyP / 04 октября 2018
0 голосов
2 ответов

Фрагмент кода выглядит следующим образом: initial_load = hc.sql('select * from...

Emma Vaze / 03 октября 2018
0 голосов
1 ответ

Я пытаюсь использовать функцию like для столбца с другим столбцом.Можно ли использовать Column...

Shankar / 03 октября 2018
0 голосов
0 ответов

У меня есть два кадра данных в PySpark, скажем, A, B, структура которых выглядит как показано ниже

JMD / 03 октября 2018
0 голосов
1 ответ

У меня есть фрейм данных, который выглядит следующим образом: |id |val1|val2| +---+----+----+ |1 |1...

Emad Elazhary / 02 октября 2018
0 голосов
3 ответов

У меня есть 500 столбцов в моем фрейме данных pyspark ... Некоторые имеют строковый тип, некоторые...

Emma / 01 октября 2018
0 голосов
0 ответов

Код: from pyspark.sql import functions as F df = df.select(F.trim("MyColumn")) Ошибка:...

simplycoding / 01 октября 2018
0 голосов
1 ответ

Я хочу конвертировать паркетные файлы в двоичном формате в CSV-файлы.Я использую следующие команды...

Pri31 / 01 октября 2018
0 голосов
1 ответ

У меня есть простая таблица со следующими столбцами ID int DESC nvarchar(255) Эта таблица...

STORM / 30 сентября 2018
0 голосов
1 ответ

Я хочу сделать что-то вроде этого ... Если у меня есть 50 столбцов в моем фрейме данных, и я хочу...

Emma / 30 сентября 2018
0 голосов
0 ответов

Мне нужно создать таблицу кустов через pyspark, но я не могу этого сделать из-за имен специальных...

Raja / 28 сентября 2018
0 голосов
0 ответов

Я подключаю базу данных mongodb через pymongo и достиг ожидаемого результата при извлечении ее за...

Raja / 28 сентября 2018
0 голосов
2 ответов

Я хочу знать, как загрузить / импортировать CSV-файл в mongodb с помощью pyspark.У меня есть...

swetha reddy / 28 сентября 2018
0 голосов
2 ответов

Используя pyspark, я обновляю таблицу mysql, схема имеет ограничение уникального ключа для...

Raghav salotra / 27 сентября 2018
0 голосов
0 ответов

У меня есть задания pyspark, а также некоторые скрипты python для предварительной обработки наборов...

Spark Scala Developer / 27 сентября 2018
0 голосов
0 ответов

Я пытаюсь построить Матрицу корреляции Однако, когда я проверяю результаты, они не совпадают....

user 923227 / 26 сентября 2018
0 голосов
0 ответов

Я пытаюсь с помощью pyspark преобразовать таблицу, похожую на эту Key Value Creation date Last...

Jean-Christophe / 24 сентября 2018
0 голосов
1 ответ

В HDFS у меня есть такие каталоги, как этот hdfs: // имя хоста / данные / канал / данные / dt =...

kikee1222 / 23 сентября 2018
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...