Вопросы с тегом апаш-искра

0 голосов

1 ответ

Цеппелин динамически загружает банки

Внутри Zeppelin Я хочу иметь возможность динамически загружать банки в Livy из корпоративного...

Georg Heiler / 06 июля 2018

0 голосов

2 ответов

Какие типы сжатия поддерживаются в паркете?

Я писал данные на Hadoop и куст в формате паркета, используя спарк. Я хочу включить сжатие, но я...

User_qwerty / 06 июля 2018

0 голосов

0 ответов

Как передать сигнал Spark, что R-код завершил процесс и сгенерировал CSV-файл?

Я хочу интегрировать R-код со Spark. Я успешен в интеграции. После этой интеграции мой код R...

Shankar Kanap / 06 июля 2018

0 голосов

2 ответов

AnalysisException: запросы с потоковыми источниками должны выполняться с помощью writeStream.start ()

Я получаю исключение, которое указывает, что мне нужно запустить поток, чтобы использовать его. Тем...

cscan / 06 июля 2018

0 голосов

1 ответ

Скрыть значение переменной среды Spark от ps и веб-интерфейса

Я новичок в Spark, нужна помощь экспертов, пожалуйста. Я использую Spark 2.3.1 на MAC, в JAVA У...

sue / 06 июля 2018

0 голосов

2 ответов

выражение искрового регистра для SQL DSL

Как я могу получить доступ к выражению катализатора (не обычному UDF) в API Spark SQL scala DSL?...

Georg Heiler / 05 июля 2018

0 голосов

1 ответ

Py4JJavaError: Произошла ошибка при вызове o288.fit

При запуске примера кода Tfidf из документации по spark 2.2.0, вот ссылка: https://spark.apache

Mr.Panchamia / 05 июля 2018

0 голосов

1 ответ

Искра: ОШИБКА Приложение было убито. Причина: все мастера не отвечают

У меня проблема при попытке запустить приложение в кластере искр с именем mymaster (и я проверил...

diens / 05 июля 2018

0 голосов

1 ответ

спарк перераспределение / исполнитель несоответствия командной строки против Jupyter

Я не был уверен, что озаглавить этот вопрос - рад за предложенное лучшее резюме Я бьюсь головой,...

Renée / 05 июля 2018

0 голосов

2 ответов

Как получить минимальное и максимальное значения столбцов?

Я хочу провести концептуальную проверку своего кода. Цель состоит в том, чтобы вычислить...

ScalaBoy / 05 июля 2018

0 голосов

1 ответ

Не удается прочитать CSV-файл Apache Zeppelin 0.8

Я сейчас использую Apache Zeppelin 0.8. Я попытался загрузить CSV-файл так: val df = spark.read

Skeftical / 05 июля 2018

0 голосов

1 ответ

Sparkstreaming + Кафка в hdfs

Когда я пытаюсь использовать сообщение из темы kafka, используя spark streaming, получаю ошибку...

Pragya Raj / 05 июля 2018

0 голосов

0 ответов

Повторное задание Spark требует памяти водителя

Я делаю несколько повторных заданий в приложении Spark: Я читаю сжатый snappy файл паркета и...

Rolintocour / 05 июля 2018

0 голосов

1 ответ

Параметр искровой памяти

Я использую дистрибутив Cloudera Hadoop, и используется версия Spark2 2.2. Я искал параметры...

Prashant / 05 июля 2018

0 голосов

0 ответов

Исполнителям Spark требуется память водителя

У меня есть 2 искровые приложения. Первое чтение CSV-файлов затем переводит его в паркет (простое...

Rolintocour / 05 июля 2018

0 голосов

2 ответов

Состояние Spark Job, работающего в Amazon EMR в режиме RESTful

У меня есть идея сделать то же самое с cli следующим образом: yarn application --status...

Utkarsh Saraf / 05 июля 2018

0 голосов

0 ответов

на ноутбуке spark jupyter не отображается вывод консоли scala

1) Я изучаю потоковую передачу и сталкиваюсь с проблемами, когда ничего не отображается (println...

r poon / 05 июля 2018

0 голосов

1 ответ

В Spark, как мне сложить мой RDD на пары?

Предположим, у меня есть RDD целых чисел, который выглядит следующим образом: (1,2,3,4,5,6,7,8) (т....

hawkeye / 05 июля 2018

0 голосов

1 ответ

Набор данных Spark в файле Hive vs Parquet

У меня есть 2 экземпляра для одинаковых данных. Таблица кустов myData в формате паркета Файл для...

boger / 05 июля 2018

0 голосов

1 ответ

Извлеките Json из массива внутри JSON в искре

У меня сложный столбец JSON, структура которого: история { карты: [{story-elements: [{...} {...} {.

NamrataK / 05 июля 2018

0 голосов

1 ответ

Исключения Kafka при загрузке более 1 потребителя из одной группы с помощью потоковой передачи с искрой

Я использую CreateDirectStream Kafka для создания потребителей из моего приложения потоковой...

DigitalFailure / 05 июля 2018

0 голосов

0 ответов

Задание не сериализуемо. Исключение. При использовании искры KeyValueGroupedDataset и каждой группы объединяются в окне.

Процесс детализации следующим образом: загрузка потоковой передачи данных с Kafka используйте...

JunZhang / 05 июля 2018

0 голосов

1 ответ

Py4JJavaError: Произошла ошибка при вызове o26.parquet. (Чтение паркетного файла)

Пытается прочитать файл Parquet в PySpark, но получает Py4JJavaError. Я даже попытался прочитать...

Shirish Kadam / 05 июля 2018

0 голосов

1 ответ

Где же спровоцировать чтение локального файла при запуске приложения в режиме клиента

Я развернул искру Автономный кластер.172.16.133.15 - мастер с двумя рабочими на одной машине, и он...

W.X / 05 июля 2018

0 голосов

0 ответов

zeppelin spark saveAsTextFile

Что случилось, если я запустил rdd.saveAsTextFile () в записной книжке zeppelin? Я не могу найти...

HelloSpark / 05 июля 2018