Вопросы с тегом апаш-искровой SQL - PullRequest

Вопросы с тегом апаш-искровой SQL

0 голосов
0 ответов
0 голосов
0 ответов

У меня есть исходные данные из файла CSV, и я должен проверить их на качество данных....

Jagadeesh Waran / 21 марта 2019
3 голосов
4 ответов

Я обрабатываю паркет от S3 TSV до S3 с помощью клея AWS.Из-за входящих файлов, отличных от UTF-8, я...

Chris KL / 21 марта 2019
0 голосов
1 ответ

это мой стол: +--------+----+----------+----+ | station|temp| dateS|hour|...

Marco_Z / 21 марта 2019
1 голос
0 ответов

Я бы хотел применить функции сводной и настраиваемой статистики ко всем столбцам независимо и...

Kenny / 21 марта 2019
0 голосов
1 ответ

Я стремлюсь эффективно сгладить файл паркета в Spark с помощью Scala.Мне было интересно, какой...

Defcon / 20 марта 2019
0 голосов
1 ответ

Я пытаюсь запросить Cassandra из Spark, используя CassandraSQLContext, но я получаю странную...

belgacea / 20 марта 2019
0 голосов
1 ответ

Я хочу сделать подсчет за окном. Результат подсчета агрегации должен быть сохранен в новом столбце:...

SimbaPK / 20 марта 2019
1 голос
1 ответ

я пытаюсь создать фрейм данных со следующим условием: У меня есть несколько идентификаторов,...

Nika / 20 марта 2019
0 голосов
0 ответов

Как расширить векторный столбец, присутствующий в кадре данных искры, в скалярные столбцы

Yashwanth Madaka / 20 марта 2019
0 голосов
0 ответов

Я написал метод фильтрации кадра данных с использованием выражений SQL.Так как некоторые sqlStr...

samba / 20 марта 2019
0 голосов
1 ответ
0 голосов
1 ответ

Я пытаюсь создать собственный преобразователь для своей модели, используя PySpark & ​​Spark 2.2. Я...

Harelz / 20 марта 2019
0 голосов
2 ответов

Шаг 1. Я создал Dataframe df с двумя столбцами «COLUMN A» и «COLUMN B» типа string. Шаг 2: Я создал...

BigData newbie / 20 марта 2019
0 голосов
1 ответ

Я пытаюсь передать всю строку в spark udf вместе с несколькими другими аргументами. Я не использую...

Manoranjan / 20 марта 2019
0 голосов
0 ответов

Мой код: { val data = sc.wholeTextFiles("file:///home/cloudera/Desktop/sampledata") data:...

Kumar / 20 марта 2019
0 голосов
1 ответ

Ниже приведен пример тестового кода и его вывод. Я вижу, что java bigDecimal хранит все цифры, в то...

user2033347 / 20 марта 2019
0 голосов
0 ответов

На данный момент у меня есть функция в PySpark, которая: def df_to_jira (df): «»» Необходимо...

Anish Nair / 19 марта 2019
0 голосов
1 ответ
0 голосов
0 ответов

DataFrame column1 ant get 0.75 maven put -0.75 большие данные get 1.25 scala sdk put 3.45 Отдельные...

Divya / 19 марта 2019
0 голосов
1 ответ

У меня есть столбец с именем datetime, представляющий собой строку вида Month Name DD YYYY H:MM:SS...

MrL / 19 марта 2019
2 голосов
2 ответов

Мне нужно создать фрейм данных с n строками, и каждое значение столбца строки инициализируется...

Sasank Annavarapu / 19 марта 2019
0 голосов
3 ответов

Данный фрейм данных: +-----------------+---------+-----------------+ | user_id| id|...

Rishabh Ojha / 19 марта 2019
1 голос
2 ответов
0 голосов
1 ответ

Я использую Java Spark для статистики набора данных. Мне нужно объединить набор данных по множеству...

BerSerK / 19 марта 2019
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...