Вопросы с тегом апаш-искровой SQL - PullRequest

Вопросы с тегом апаш-искровой SQL

0 голосов
2 ответов

Я получаю данные JSON от Кафки методом from_json().Он ожидает от меня схемы.Моя структура JSON...

ogma / 27 февраля 2019
0 голосов
1 ответ

У меня есть набор данных, содержащий две строки ниже s.no,name,Country 101,xyz,India,IN 102,abc...

Johny_Bravo / 27 февраля 2019
0 голосов
1 ответ

У меня есть таблица, возьмите таблицу в качестве кадра данных. id | Formula | Step | Value | 1 |...

sparkscala / 27 февраля 2019
0 голосов
1 ответ

Существует ли определенный стандарт для эффективного управления памятью в Spark Что если я в итоге...

Dixon / 27 февраля 2019
0 голосов
2 ответов

У меня проблема с Spark SQL, когда при типе столбца, если я приведу тип от строки к метке времени,...

knowone / 27 февраля 2019
0 голосов
1 ответ

Я хочу центрировать столбец в кадре данных Spark, т. Е. Вычесть каждый элемент в столбце из...

Benjamin Du / 27 февраля 2019
0 голосов
0 ответов

У меня есть DF с ~ 500K записями: org.apache.spark.sql.DataFrame Я пытаюсь записать DF в папку...

vikky / 27 февраля 2019
0 голосов
0 ответов

В настоящее время я работаю с 3 фреймами данных и объединяю их вместе, начиная с фрейма network и...

sectechguy / 27 февраля 2019
0 голосов
1 ответ

У меня есть фрейм данных искры df1 id transactions 1 [1, 2, 3, 5] 2 [1, 2, 3, 6] 3 [1, 2, 9, 8] 4...

priya / 27 февраля 2019
0 голосов
1 ответ

В настоящее время я работаю над Spark версии 2.1.0, в рамках моей работы по сбору данных я должен...

Ajay Kharade / 26 февраля 2019
0 голосов
0 ответов

Я хочу взять все предыдущие строки в наборе данных, которые соответствуют определенным критериям...

Francisco Ferreira / 26 февраля 2019
0 голосов
1 ответ

я работаю с zeppelin, я читаю много файлов из многих источников в потоковой передаче с плагинами:с...

b2ooba / 26 февраля 2019
0 голосов
1 ответ

Я реализовал алгоритм классификации в Spark, который включает в себя расчет расстояний между...

oulenz / 26 февраля 2019
0 голосов
1 ответ

Похоже, что Hortonworks Hive Warehouse Connector до v.1.0.0 не поддерживает обновления схемы.Я...

Eugene Lopatkin / 26 февраля 2019
0 голосов
1 ответ

У меня есть требования для чтения случайных файлов JSON в разных папках, где данные изменились

Rohan Nayak / 26 февраля 2019
0 голосов
0 ответов

Я получаю эту ошибку при выполнении большого количества запросов Spark SQL.В запросах много...

Prashant / 26 февраля 2019
0 голосов
0 ответов

У меня есть таблица columnstore в MemSQL, схема которой аналогична приведенной ниже: CREATE TABLE...

VarunG / 26 февраля 2019
0 голосов
1 ответ

У меня есть файл, разделенный запятыми, без заголовка, с различным количеством элементов в каждой...

Samer Ayoub / 26 февраля 2019
0 голосов
0 ответов

У меня огромный кластер данных в искре.count показывает 24 миллиона строк.Также имеется более 900...

Rocky Li / 25 февраля 2019
0 голосов
0 ответов

Я получаю эту ошибку, когда пытаюсь преобразовать значения в surrogateDF свойстве pyspark.ml

Jeff Saremi / 25 февраля 2019
0 голосов
0 ответов

Я записываю свой фрейм данных искровой потоковой передачи в виде файла паркета в моей HDFS.Я создал...

BigD / 25 февраля 2019
0 голосов
1 ответ

Использование PySpark. Follow : я думаю, что мне нужно только знать, как выбрать n элементы после...

Tony / 25 февраля 2019
0 голосов
1 ответ

У меня есть приложение Spark Streaming, которое считывает имена таблиц Hive в записях Kafka,...

Srijit / 25 февраля 2019
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...