Вопросы с тегом pyspark-SQL - PullRequest

Вопросы с тегом pyspark-SQL

0 голосов
1 ответ

REGEXP_INSTR Функция: выполняет поиск в строке шаблона регулярного выражения и возвращает целое...

AWSGeekCoder / 25 октября 2019
1 голос
1 ответ

Я пытаюсь найти минимальную дату в столбце «dateclosed» в фрейме данных pyspark. Затем я хочу...

user3476463 / 24 октября 2019
0 голосов
0 ответов

Ниже приведен мой код: from pyspark.sql import SparkSession import pandas as pd from pyspark.sql...

Jorrick Sleijster / 24 октября 2019
0 голосов
1 ответ

Я выполняю следующую команду Redshift SQL, используя оператор POSIX (~) для сопоставления с...

AWSGeekCoder / 24 октября 2019
1 голос
0 ответов

У меня есть образец кадра данных панд, как показано ниже. Но мои реальные данные 40 million rows...

AVLES / 24 октября 2019
1 голос
1 ответ

Я ищу ссылки на файлы, не относящиеся к Python (например, SQL, config, txt), сохраненные в формате

simonslav / 23 октября 2019
0 голосов
1 ответ

Я пытаюсь использовать функцию regex_extract, чтобы получить последние три цифры в строке...

Rusty / 23 октября 2019
0 голосов
2 ответов

Я не могу подключиться к kafka_2.12-2.3.0 из структурированной потоковой передачи spark_2.4.4,...

Grej / 23 октября 2019
0 голосов
1 ответ

Я работаю в Python, а не в Scala. Итак, мой текущий вывод, который представляет собой фрейм данных,...

devb / 23 октября 2019
0 голосов
0 ответов

Pyspark.sql.dataframe преобразует данные массива каждого столбца конкретной строки в новый фрейм...

zubug55 / 23 октября 2019
0 голосов
1 ответ

Я хочу выбрать n случайных строк (без замены) из фрейма данных PySpark (предпочтительно в форме...

Siddharth Satpathy / 23 октября 2019
0 голосов
1 ответ

Мы видим, что объединяет несколько таблиц улья. Если я использую spark SQL в pyspark и прочитал это...

Aravind P / 23 октября 2019
0 голосов
0 ответов

У меня есть строка метки времени с микросекундами следующим образом: +-------------------------+...

lutybr / 22 октября 2019
0 голосов
1 ответ

Я хотел бы иметь столбец row_number (), основанный на 2 столбцах в существующем фрейме данных с...

Varun Vembar / 22 октября 2019
0 голосов
1 ответ

У меня есть датафрейм, как показано ниже df = pd.DataFrame({ 'subject_id':[1,1,1,1,2,2,2...

AVLES / 22 октября 2019
0 голосов
0 ответов

У меня есть приложение PySpark, которое прекрасно работает, когда я пытаюсь установить свойства...

sam1977 / 22 октября 2019
0 голосов
1 ответ

У меня есть кадр данных Spark, который выглядит примерно так: id country date action 1 A 2019-01-01...

Tim496 / 21 октября 2019
2 голосов
2 ответов

У меня очень большой фрейм данных (450000 строк) с данными датчика и отметкой времени, что-то вроде...

lutybr / 21 октября 2019
2 голосов
2 ответов

Я только начинаю изучать spark, меня немного смущает эта концепция, поэтому из установки spark мы...

JYBLTN / 21 октября 2019
0 голосов
1 ответ

У меня есть ниже в Spark. это прекрасно работаетМне просто интересно, как я буду выполнять функции...

kikee1222 / 20 октября 2019
0 голосов
0 ответов

Я пытаюсь исключить данные, начинающиеся с обратной косой черты в данных таблицы. Я отфильтровал...

User501 / 20 октября 2019
1 голос
1 ответ

У меня есть два разных кадра данных, и я хочу узнать количество пересечений между m столбцами из...

rajat kabra / 18 октября 2019
0 голосов
1 ответ

Мне интересно, будет ли sqlContext.sql("query") поддерживать все функции SQL,...

user1503 / 18 октября 2019
0 голосов
1 ответ

У меня есть скрипт ниже. Я немного застрял с этим конкретным фрагментом: datex = datetime.datetime

kikee1222 / 18 октября 2019
0 голосов
0 ответов

Я выполняю около 80 запросов, используя spark.sql и createAndReplaceTempView. Но моя работа не...

SUBHOJEET / 18 октября 2019
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...