Вопросы с тегом apache-искра - PullRequest

Вопросы с тегом apache-искра

0 голосов
1 ответ

Я попытался импортировать другой файл python в моей текущей программе pyspark, используя...

Neha patel / 04 марта 2019
0 голосов
0 ответов

Я пытаюсь выполнить в реальном времени ввод данных Kafka в HBase через PySpark в соответствии с...

thedbogh / 04 марта 2019
0 голосов
0 ответов

Я пытаюсь прочитать файлы паркетных разделов S3 (fake - localstack), используя Pyspark (2.4) с...

agonen / 04 марта 2019
0 голосов
1 ответ

Я использую python с потоковой передачей искры, и идея проста: сделать монитор потоковой передачи...

Michael / 03 марта 2019
0 голосов
1 ответ

Необходимо включить ведение журнала INFO для получения подробной информации, но можно...

Sourav Ghosh / 03 марта 2019
0 голосов
2 ответов

my pom.xml (просто кусок) выглядит следующим образом: <dependency> <groupId>org.apache

bib / 01 марта 2019
0 голосов
1 ответ

У меня есть датафрейм.Мне нужно преобразовать каждую запись в JSON, а затем вызвать API с полезной...

Basant Jain / 01 марта 2019
0 голосов
0 ответов

У меня возникает следующая проблема каждый раз, когда я пытаюсь вызвать простое действие для rdd,...

Spartan / 01 марта 2019
0 голосов
1 ответ

У меня есть фрейм данных (Dataset<Row>), в котором шесть столбцов, из шести необходимо...

Vicky / 01 марта 2019
0 голосов
0 ответов

Каждый час я получаю некоторые обновления значений в качестве нового DataFrame.Я должен уменьшить...

VB_ / 01 марта 2019
0 голосов
1 ответ

У меня есть один столбец pyspark.sql.dataframe.DataFrame (comments), это выглядит так:...

EddieZahoree / 28 февраля 2019
0 голосов
0 ответов

У меня есть приложение PySpark, которое обрабатывает файлы в папке, используя wholeTextFiles().Это...

Ashish Nijai / 28 февраля 2019
0 голосов
2 ответов

У меня есть таблица из трех столбцов [s,p,o].Я хотел бы удалить строки, чтобы для каждой записи в s...

user1848018 / 28 февраля 2019
0 голосов
0 ответов

Я пытаюсь вернуть матрицу значений из UDF Pandas Grouped Map. При определении схемы я даю Array...

ruggfrancesco / 28 февраля 2019
0 голосов
1 ответ

В определенный момент моего кода у меня есть два разных типизированных набора данных.Мне нужны...

RLM / 28 февраля 2019
0 голосов
1 ответ

В pyspark , предположим, у меня есть фрейм данных со столбцами с именем 'a1'...

Xinyu Zhou / 28 февраля 2019
0 голосов
0 ответов

У меня проблема: я следую этому руководству по официальной документации Livy: [https://livy

THIBAULT Nicolas / 27 февраля 2019
0 голосов
1 ответ

Мы работаем с Spark 2.4.0 / Scala 2.11 и запускаем несколько потоковых приложений Spark, слушающих...

Lokesh Kumar P / 27 февраля 2019
0 голосов
1 ответ

У меня странное поведение API запроса SQL sql, например: У меня есть следующий набор данных:...

Anton.P / 27 февраля 2019
0 голосов
0 ответов

У меня есть сценарий использования для клиента, который должен загружать большие данные из...

illicit / 27 февраля 2019
0 голосов
0 ответов

В настоящее время я работаю с 3 фреймами данных и объединяю их вместе, начиная с фрейма network и...

sectechguy / 27 февраля 2019
0 голосов
1 ответ

У меня есть файл csv presence.csv в моем файле данных: TIME,RESULT,PARENTLOCALIZATIONCODE...

Steven / 26 февраля 2019
0 голосов
0 ответов

У меня огромный кластер данных в искре.count показывает 24 миллиона строк.Также имеется более 900...

Rocky Li / 25 февраля 2019
0 голосов
2 ответов
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...