Вопросы с тегом апаш-искровой SQL - PullRequest

Вопросы с тегом апаш-искровой SQL

0 голосов
1 ответ

Имеем таблицу (Data), как показано ниже: color status freq red y 1 blue y 1 green y 2 Ожидаемый...

swcraft / 23 ноября 2018
0 голосов
2 ответов

Я хочу преобразовать List [Map] в фрейм данных spark, ключи Map - это sname, ключи Map - это...

user7687835 / 23 ноября 2018
0 голосов
0 ответов

Я пытаюсь отправить обработанные Spark данные в кластер с 3 узлами C *.Я отправляю 200 миллионов...

Shyam / 23 ноября 2018
0 голосов
0 ответов

Лучше всего объяснить эту проблему на примере. Исходные данные Key | Value ----------- A | 1 A | 2...

foobar / 22 ноября 2018
0 голосов
1 ответ

У меня есть данные GeoJSON в виде structtype, подобного следующему: root |-- features: array...

Mak / 22 ноября 2018
0 голосов
1 ответ

Я хочу создать новый столбец, содержащий количество данных в зависимости от фильтра. Вот пример:...

zineb .el / 22 ноября 2018
0 голосов
1 ответ

Я хотел получить данные, хранящиеся в кластере Hadoop Cloudera, через Hive, Spark или SQL.У меня...

Tilo / 22 ноября 2018
0 голосов
1 ответ

Хотите сравнить типы данных двух наборов данных в искре, используя Java.

Naresh / 22 ноября 2018
0 голосов
3 ответов

Команда , я работаю с фреймом данных, выглядит следующим образом: df client | date C1 |08-NOV-18 11

Chaouki / 22 ноября 2018
0 голосов
1 ответ

Я пытаюсь прочитать CSV-файл, содержащий около 7 миллионов строк и 22 столбца. Как сохранить его в...

Sayan Sahoo / 22 ноября 2018
0 голосов
0 ответов

Я знаю, что старые версии Spark поддерживают только тип BigDecimal из java.math.Но я нашел этот...

Stanislav Molchanovsky / 22 ноября 2018
0 голосов
3 ответов

Я пытаюсь преобразовать мой pyspark sql dataframe в json, а затем сохранить в виде файла. df_final...

Shankar Panda / 22 ноября 2018
0 голосов
1 ответ

Есть ли способ отправить несколько пользовательских сообщений из Executor в Driver In Apache Spark

Sourav Gulati / 22 ноября 2018
0 голосов
1 ответ

Я пытаюсь рассчитать статистику для каждого числового поля.Но я застрял здесь, как исключить null...

Shankar Panda / 22 ноября 2018
0 голосов
2 ответов

Я хочу получить дубликаты записей в кадре данных Spark Scala.Например, я хочу получить дубликаты...

stack0114104 / 22 ноября 2018
0 голосов
1 ответ

У меня есть две таблицы с включенным ведением. DESCRIBE EXTENDED table1 Table |table1 | | |Owner...

Tomasz Krol / 22 ноября 2018
0 голосов
0 ответов

Я вижу несколько вопросов, связанных с этим, но все решения - использовать заголовки, правда.Тем не...

Brad Ellis / 21 ноября 2018
0 голосов
1 ответ

Я отправляю имя столбца в цикле for и хочу использовать эту переменную (которая содержит имя...

Shankar Panda / 21 ноября 2018
0 голосов
2 ответов
0 голосов
0 ответов

У нас есть кластер Cassandra, и я пишу код pyspark для извлечения данных из Cassandra в кластер...

Ashwani Singh / 21 ноября 2018
0 голосов
4 ответов

spark UDF работает, когда я делаю show(), но выдает ошибку, когда я получаю filter на UDF...

jinhwan / 21 ноября 2018
0 голосов
0 ответов

Как мне создать и добавить CSV-файл из результата rdd, используя pyspark Это мой код.Для каждой...

Shankar Panda / 21 ноября 2018
0 голосов
1 ответ

Я пытаюсь записать результаты переменной в CSV-файл, а затем создать из него JSON.Каждая итерация...

Shankar Panda / 21 ноября 2018
0 голосов
1 ответ

У меня есть фрейм данных с обзором и рейтингом колонок в Spark Scala val stopWordsList = scala.io

Nick / 21 ноября 2018
0 голосов
0 ответов

У меня очень простое задание рабочего процесса oozie, выполняющее всего одно действие pyspark из...

WEIHANG LIU / 21 ноября 2018
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...