Вопросы с тегом апаш-искровой SQL - PullRequest

Вопросы с тегом апаш-искровой SQL

1 голос
1 ответ

Я пытаюсь настроить конфигурацию нескольких параметров искры внутри оболочки pyspark. Я попробовал...

Clock Slave / 08 марта 2019
0 голосов
1 ответ

У меня есть следующий код ageDF.sort('Period') .groupBy('Period')

Rudy / 08 марта 2019
0 голосов
1 ответ

Поддерживает ли Spark SQL (DSL, а не API) оконную функцию в структурированной потоковой передаче

J Wu / 08 марта 2019
3 голосов
1 ответ

У меня есть следующий pyspark df: +------------------+--------+-------+ | ID| Assets|Revenue|...

himi64 / 07 марта 2019
1 голос
3 ответов

У меня есть столбец с типом Timestamp в формате yyyy-MM-dd HH:mm:ss в кадре данных. Столбец...

Yorel Live / 07 марта 2019
5 голосов
2 ответов

Я проверяю искровые десятичные типы для валютных показателей и вижу некоторые странные результаты...

Jared / 07 марта 2019
3 голосов
1 ответ

Контекст: Мне нужно отфильтровать фрейм данных на основе того, что содержит столбец другого фрейма,...

LePuppy / 07 марта 2019
0 голосов
1 ответ

Я перебираю Dataset<Row>, используя ForeachFunction, в то время как во время перебора я не...

Vicky / 07 марта 2019
1 голос
1 ответ

У меня есть такой фрейм данных data = [(("ID1", {'A': 1, 'B': 2}))]...

Hardik gupta / 07 марта 2019
0 голосов
1 ответ

В pyspark мы пытаемся объединить два фрейма данных.мы соединяем фрейм данных с другим (который сам...

Kumar / 07 марта 2019
0 голосов
2 ответов

Я не могу отправить каждую группу данных за один раз исполнителю. У меня есть данные как в...

Shyam / 07 марта 2019
0 голосов
1 ответ

У меня есть схема structType, мне нужно упорядочить / отсортировать схему на основе имени поля,...

svk 041994 / 07 марта 2019
0 голосов
1 ответ

Как минимизировать время выполнения моего запроса с помощью pyspark? Я использую базу данных...

Srinivasan E / 07 марта 2019
0 голосов
1 ответ

В pyspark у меня есть следующее: import pyspark.sql.functions as F cc = F.lit(1)

lezebulon / 07 марта 2019
4 голосов
0 ответов

Я пытаюсь определить статус завершения на разных уровнях детализации.Например, регион является...

himanshu / 06 марта 2019
1 голос
2 ответов
0 голосов
1 ответ

Афины таблицы "организация" считывают данные из паркетных файлов в s3.Мне нужно изменить имя...

sandy / 06 марта 2019
1 голос
1 ответ
1 голос
0 ответов

У меня есть следующий фрейм данных: +--------+------+---------+---------+ | Col1 | col2 | values1 |...

John Humanyun / 06 марта 2019
0 голосов
2 ответов

У меня есть два кадра данных A и B. A +---+------+-----+----------+ | id|player|score| date|...

Chemssii / 06 марта 2019
0 голосов
0 ответов

Я выполняю запрос, подобный select <column> from <mytable> where <partition_key>...

user1639848 / 06 марта 2019
0 голосов
1 ответ

Я реализую источник данных Spark (v2) и не нашел способа обеспечить локальность данных. В источнике...

Venus / 06 марта 2019
0 голосов
0 ответов

В пользовательском интерфейсе Spark тег этапа показывает задачи и DAG https://www.waitingforcode

Joe C / 06 марта 2019
0 голосов
1 ответ

Я новичок в PySpark и пытаюсь читать HDFS-файлы (на которых созданы таблицы кустов) и создавать...

rightjoin / 06 марта 2019
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...