Вопросы с тегом апаш-искровой SQL - PullRequest

Вопросы с тегом апаш-искровой SQL

0 голосов
2 ответов

У меня есть сценарий использования, где схемой столбца является String, но на самом деле это json...

K P / 31 октября 2018
0 голосов
2 ответов

В одном из столбцов моего информационного кадра есть следующая строка:...

Mantovani / 31 октября 2018
0 голосов
1 ответ

Если я правильно понимаю, ArrayType можно добавить как столбцы Spark DataFrame. Я пытаюсь добавить...

TJVR / 30 октября 2018
0 голосов
0 ответов

Можно ли прочитать удаленный файл CSV в DataFrame с помощью объекта SparkSession? Или рекомендуется...

mmnormyle / 30 октября 2018
0 голосов
1 ответ

предположим, у меня есть несколько файлов CSV в одном каталоге, все эти файлы имеют одну и ту же...

mmnormyle / 30 октября 2018
0 голосов
2 ответов

У меня проблема с разбиением столбца метки времени на столбцы даты и времени. Сначала время не...

SimbaPK / 30 октября 2018
0 голосов
2 ответов

У меня есть данные, как показано ниже, и я хочу уменьшить их, комбинируя соседние строки, т.е....

stack0114106 / 30 октября 2018
0 голосов
1 ответ

У меня есть фрейм данных pyspark, а один столбец - это список идентификаторов. Я хочу, например,...

Nevermore / 30 октября 2018
0 голосов
0 ответов

Кто-нибудь реализовывал Recall на k для оценки рекомендательной системы, построенной с...

avinax / 30 октября 2018
0 голосов
0 ответов

У меня около 4 тысяч файлов Parquet, которые содержат большие вложенные объекты с ~ 250 различными...

Dalphin / 30 октября 2018
0 голосов
1 ответ

Я использую версию spark-sql_2.11-2.3.1 с Cassandra 3.x. Мне нужно предоставить функцию проверки,...

Shyam / 30 октября 2018
0 голосов
1 ответ

Динамический выбор нескольких столбцов при объединении разных Dataframe в Scala Spark По...

Babu / 30 октября 2018
0 голосов
2 ответов

Мне нужно запросить HBASE, а затем работать с данными с помощью spark и scala. Моя проблема в том,...

SimbaPK / 29 октября 2018
0 голосов
1 ответ

Платформа данных Hortonworks HDP 3.0 имеет версии 2.3 и Hive 3.1, по умолчанию приложения spark 2.3...

Shan / 29 октября 2018
0 голосов
1 ответ

Я использую «Временное окно в Spark SQL» для агрегирования данных временных рядов за различные...

Remis Haroon / 29 октября 2018
0 голосов
2 ответов

С RDD легко и просто с точки зрения получения epochDate: val rdd2 = rdd.map(x => (x._1, x._2, x

thebluephantom / 29 октября 2018
0 голосов
1 ответ

У меня есть следующий метод для записи в Кассандру, когда он хорошо сохраняет данные. Когда я...

Shyam / 29 октября 2018
0 голосов
1 ответ

Я хочу назначить искровую функцию SQL переменной. Например: val func = org.apache.spark.sql

J. Doe / 29 октября 2018
0 голосов
1 ответ

Можно ли использовать передаваемый фрейм данных в UDF приложения pyspark SQl. Мой код вызывает...

vignesh asokan / 29 октября 2018
0 голосов
1 ответ

У меня есть агрегат, используя следующий код: Получите ежемесячные итоги продаж: summary = data

Naseer / 29 октября 2018
0 голосов
2 ответов
0 голосов
2 ответов

Мне нужно разбить большой текстовый файл в S3, который может содержать ~100 million records, на...

loks / 29 октября 2018
0 голосов
2 ответов

Я новичок в спарке и пытаюсь найти конкретную информацию о паре списков данных, которые я...

AntarianCoder / 29 октября 2018
0 голосов
1 ответ

Я пытаюсь записать большой набор многораздельных данных на диск с помощью Spark, и алгоритм...

Powers / 29 октября 2018
0 голосов
0 ответов

Я создал собственный соединитель для SPARK (в Mule ESB) К сожалению, я получаю ошибку: `Exception...

Piotr B / 28 октября 2018
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...