Вопросы с тегом апаш-искра

0 голосов

1 ответ

Несовместимая версия Jackson при использовании Spark Connector для CosmosDB

Я получил исключение при попытке чтения из набора данных SparkSql с помощью разъема cosmosdb в...

Carlos Raffellini / 20 февраля 2019

0 голосов

1 ответ

Spark Streaming - обновить статические данные

У меня есть задание Spark Streaming, которое при запуске запрашивает Hive и создает объект Map [Int...

CatchingMonkey / 20 февраля 2019

0 голосов

1 ответ

Как добавить Id для всех строк данных в спарк

Привет, моя структура файла CSV похожа на File-1 id col1 col2 a_1 sd fd ds emd sf jhk File-2 id...

Y0gesh Gupta / 20 февраля 2019

0 голосов

0 ответов

В каком каталоге Spark хранит перемешанные / разлитые данные?

Где Spark хранит временные данные при перетасовке и разлитые данные, если СДР не умещается в памяти

MetallicPriest / 20 февраля 2019

0 голосов

1 ответ

С точки зрения Spark, действительно ли планировщики пряжи отличаются?

Пряжа имеет два известных планировщика, Fair Scheduler и Capacity Scheduler.Грубо говоря, Capacity...

Anton.P / 20 февраля 2019

0 голосов

1 ответ

Относительно того, как хранить значения файлов в переменных в Scala-программировании

Я пытаюсь прочитать файл и сохранить значения в переменной, но я не получаю правильный результат.Не...

Raghu kanala / 20 февраля 2019

0 голосов

0 ответов

Spark - эффективный способ чтения нескольких версий объекта S3 в DataFrame

Я хочу прочитать N последних версий объекта S3 и поместить их все в структуру Map [version,...

Tofig Hasanov / 20 февраля 2019

0 голосов

2 ответов

Использование воздушного потока для выполнения работ по потоковой передаче искр

В нашем кластере hadoop есть задания Spark Batch и потоковые задания Spark. Мы хотели бы...

Gilad / 20 февраля 2019

0 голосов

1 ответ

искра представить с --jar и аргументами основного класса

Как передать спарк-банку в кластер с аргументом: ./spark-submit --class package.Main --master...

Võ Trường Duy / 20 февраля 2019

0 голосов

1 ответ

Потребитель Kafka для чтения данных из темы, когда известно о смещении от и до

Могу ли я узнать, может ли потребитель kafka читать определенные записи, когда известны смещения...

Bharghavi Vajrala / 20 февраля 2019

0 голосов

1 ответ

Я не могу приспособить модель FP-Growth к искре

Пожалуйста, вы можете мне помочь?У меня есть набор данных из 80 файлов CSV и кластер из одного...

Malik Berrada / 20 февраля 2019

0 голосов

1 ответ

Как сохранить как объектные файлы в разных каталогах в Spark?

У меня есть СДР ниже: Array( (0, "xx"), (1, "xx"), (2, "xx"), (1,...

ericxluo / 20 февраля 2019

0 голосов

1 ответ

Как увеличить точность и масштаб по умолчанию при загрузке данных из Oracle с помощью spark-sql

Попытка загрузить данные из таблицы оракула, где у меня есть несколько столбцов, в которых хранятся...

Shyam / 20 февраля 2019

0 голосов

2 ответов

Spark on Yarn Не удалось отправить RPC, и ведомый потерян

Я хочу развернуть spark2.3.2 на Yarn, Hadoop2.7.3. Но когда я запускаю: spark-shell Всегда повышать...

Skateboard / 20 февраля 2019

0 голосов

1 ответ

Где предложение с функцией агрегации на SparkSQL Thriftserver, связанном с beeline

Я подключен к Spark Thrift (Spark SQL версии 2.3.1 и Hive JDBC 1.2.1.spark2) из Beeline и хочу...

Mahesh J / 20 февраля 2019

0 голосов

0 ответов

Вставка в улей стол с вкладышами из улья и искры

У нас есть таблица с наклоном улья, и данные вставляются в эту таблицу из улья.Таким образом, файлы...

Albin / 20 февраля 2019

0 голосов

2 ответов

Создание фрейма данных в цикле с произвольным именем из списка строк в Scala

Эй, у меня есть типичное требование, когда я должен создавать кадры данных в цикле с произвольным...

Anirban Goswami / 20 февраля 2019

0 голосов

1 ответ

ChiSqSelector выбирает неправильную функцию?

Я копирую вставленный этот пример из документов в моей Spark 2.3.0 оболочке. import org.apache

Gevorg / 20 февраля 2019

0 голосов

2 ответов

почему работа с spark не работает на zepplin, когда они работают при использовании оболочки pyspark

я пытаюсь выполнить следующий код на zepplin df = spark.read.csv('/path/to/csv') df

Achref Othmeni / 19 февраля 2019

0 голосов

0 ответов

Сохранение логического плана или линии Spark DataFrame для воспроизведения

Есть ли способ сохранить или сериализовать логический план Spark DataFrame и воспроизвести его

mongolol / 19 февраля 2019

0 голосов

1 ответ

Получение старых и дублированных окон в writeStream в структурированном потоке

У меня есть структурированный конвейер потоковой передачи, где я читаю из Kafka с readStream,...

riyaB / 19 февраля 2019

0 голосов

1 ответ

Создать фрейм данных из нескольких наборов данных

Я занимаюсь программированием больших данных с использованием Apache Spark и Scala.Я хочу создать...

cgt / 19 февраля 2019

0 голосов

0 ответов

Spark - как оптимизировать объект Row для большого количества столбцов в RDD

Я работаю над преобразованием файла фиксированной длины в csv с помощью spark. val recs = rdd

stack0114106 / 19 февраля 2019

0 голосов

1 ответ

Фильтр Spark DataFrame не работает должным образом со случайным

Это мой DataFrame df.groupBy($"label").count.show +-----+---------+ |label| count|...

Gevorg / 19 февраля 2019

0 голосов

0 ответов

Отсутствует файловая система для схемы: wasbs Apache Zeppelin 0.8.0 с Spark 2.3.2

Я пытаюсь запустить заметку в Apache Zeppelin 0.8.0 с Spark 2.3.2 и хранилищем BLOB-объектов Azure,...

Demyan Mysakovets / 19 февраля 2019