Внутри Zeppelin Я хочу иметь возможность динамически загружать банки в Livy из корпоративного...
Я писал данные на Hadoop и куст в формате паркета, используя спарк. Я хочу включить сжатие, но я...
Я хочу интегрировать R-код со Spark. Я успешен в интеграции. После этой интеграции мой код R...
Я получаю исключение, которое указывает, что мне нужно запустить поток, чтобы использовать его. Тем...
Я новичок в Spark, нужна помощь экспертов, пожалуйста. Я использую Spark 2.3.1 на MAC, в JAVA У...
Как я могу получить доступ к выражению катализатора (не обычному UDF) в API Spark SQL scala DSL?...
При запуске примера кода Tfidf из документации по spark 2.2.0, вот ссылка: https://spark.apache
У меня проблема при попытке запустить приложение в кластере искр с именем mymaster (и я проверил...
Я не был уверен, что озаглавить этот вопрос - рад за предложенное лучшее резюме Я бьюсь головой,...
Я хочу провести концептуальную проверку своего кода. Цель состоит в том, чтобы вычислить...
Я сейчас использую Apache Zeppelin 0.8. Я попытался загрузить CSV-файл так: val df = spark.read
Когда я пытаюсь использовать сообщение из темы kafka, используя spark streaming, получаю ошибку...
Я делаю несколько повторных заданий в приложении Spark: Я читаю сжатый snappy файл паркета и...
Я использую дистрибутив Cloudera Hadoop, и используется версия Spark2 2.2. Я искал параметры...
У меня есть 2 искровые приложения. Первое чтение CSV-файлов затем переводит его в паркет (простое...
У меня есть идея сделать то же самое с cli следующим образом: yarn application --status...
1) Я изучаю потоковую передачу и сталкиваюсь с проблемами, когда ничего не отображается (println...
Предположим, у меня есть RDD целых чисел, который выглядит следующим образом: (1,2,3,4,5,6,7,8) (т....
У меня есть 2 экземпляра для одинаковых данных. Таблица кустов myData в формате паркета Файл для...
У меня сложный столбец JSON, структура которого: история { карты: [{story-elements: [{...} {...} {.
Я использую CreateDirectStream Kafka для создания потребителей из моего приложения потоковой...
Процесс детализации следующим образом: загрузка потоковой передачи данных с Kafka используйте...
Пытается прочитать файл Parquet в PySpark, но получает Py4JJavaError. Я даже попытался прочитать...
Я развернул искру Автономный кластер.172.16.133.15 - мастер с двумя рабочими на одной машине, и он...
Что случилось, если я запустил rdd.saveAsTextFile () в записной книжке zeppelin? Я не могу найти...