Вопросы с тегом апаш-искра - PullRequest

Вопросы с тегом апаш-искра

0 голосов
0 ответов

Я использую memsql-spark-connector 2.0.6 в приложении Spark Structured Streaming. val map:...

sam22 / 24 февраля 2019
0 голосов
1 ответ

Я работаю с программой искры, которой необходимо постоянно обновлять некоторые СДР в цикле: var...

Skateboard / 24 февраля 2019
0 голосов
1 ответ

Я новичок в Spark SQL и использую объяснение, чтобы узнать, как он может оптимизировать код.Я...

Joe C / 24 февраля 2019
0 голосов
0 ответов

Я использую структурированную потоковую передачу с Kafka.В HDFS хранится около 10 различных моделей...

Vinodh Krishnaraju / 23 февраля 2019
0 голосов
1 ответ

Как лучше всего сравнить два файла csv (миллионы строк) с одной и той же схемой со столбцом...

Faizal / 23 февраля 2019
0 голосов
1 ответ

Очевидно, что нет встроенной поддержки приемника Cassandra в потоковой передаче Spark.Я нашел этот...

AbhinavChoudhury / 23 февраля 2019
0 голосов
2 ответов

У меня есть фрейм данных pyspark: ABC 1 NA 9 4 2 5 6 4 2 5 1 NA Я хочу удалить строки, содержащие...

jk1093 / 23 февраля 2019
0 голосов
0 ответов

Мне интересно, что вы испытываете, когда запускаете сложные запросы SQL с несколькими объединениями...

Tomasz Krol / 23 февраля 2019
0 голосов
0 ответов

В настоящее время мы изучаем Apache Spark (с Hadoop) для выполнения крупномасштабного...

Steve C / 23 февраля 2019
0 голосов
1 ответ

У меня есть две таблицы / фрейма данных: A и B A имеет следующие столбцы: cust_id, purch_date B...

skdhfgeq2134 / 23 февраля 2019
0 голосов
0 ответов

У меня есть огромная таблица, которую я загружаю из RedShift в csv-файл на S3, используя блокнот...

user1552698 / 23 февраля 2019
0 голосов
0 ответов

Многие обсуждения, которые я обнаружил в Интернете по поводу распределения ресурсов, были посвящены...

Supergan / 23 февраля 2019
0 голосов
1 ответ

Я выполнил следующее предложение выбора для таблицы HIVE в редакторе HUE и получил результат ниже....

F. Aydemir / 23 февраля 2019
0 голосов
0 ответов

Я уже погуглил и знал, что случайный разлив (память) - это размер десериализованной формы данных в...

Alan Li / 23 февраля 2019
0 голосов
2 ответов

Я пытаюсь создать дочерний фрейм данных из родительского фрейма данных.но у меня есть более 100...

user2232840 / 22 февраля 2019
0 голосов
2 ответов

Я новичок в экосистеме больших данных.Я пытаюсь установить Apache Spark, но в учебных руководствах,...

Arun kumar / 22 февраля 2019
0 голосов
0 ответов

Мое искровое приложение уже давно запущено. Сцена застряла в 199/200, как показано на рисунке....

Alan Li / 22 февраля 2019
0 голосов
0 ответов

Я использую: EMR 5.20 Zeppelin 0.8.0 Spark 2.4.0 Мне удалось добавить интерпретатор Redshift, но я...

hhenry / 22 февраля 2019
0 голосов
1 ответ

У меня есть udf как часть импорта, и я использую его в своем искровом коде spark

Srinivas / 22 февраля 2019
0 голосов
0 ответов

Я довольно новичок в scala, поэтому любые советы / основы приветствуются.Я пытаюсь получить доступ...

ankur / 22 февраля 2019
0 голосов
0 ответов

Как я могу использовать posexplode в искрах withColumn оператор? Seq(Array(1,2,3)).toDF

Georg Heiler / 22 февраля 2019
0 голосов
0 ответов

Ситуация, подобная этой: val lines = readKafka .... lines.foreachRDD { ... // transformation ... //...

snow / 22 февраля 2019
0 голосов
2 ответов

У меня есть датафрейм, который содержит последовательность строк.Я хочу перебирать строки по...

Kuppu / 22 февраля 2019
0 голосов
1 ответ

Я использую pyspark [spark2.3.1] и Hbase1.2.1, мне интересно, как лучше всего получить доступ к...

Chauhan B / 22 февраля 2019
0 голосов
0 ответов

zkUrl просто настройте одного зоопарка ip:port.Как я могу настроить mutiple ip:port spark

user6643089 / 22 февраля 2019
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...