Вопросы с тегом апаш-искра

0 голосов

1 ответ

спарк группа и сериализация списка

Я хочу объединить набор данных (идентификатор, оценка, поле1, поле2, поле3) по идентификатору и...

othy_gentrynin / 24 апреля 2018

0 голосов

0 ответов

Spark Streaming Ведение потоковых данных между пакетами.

Я пытаюсь построить конвейер etl, используя pyspark и kafka.Мне нужно сохранить потоки для будущих...

fali / 24 апреля 2018

0 голосов

2 ответов

Чтение массива Jsons из файла в формат данных Spark

У меня есть сжатый файл JSON, который содержит массив JSON, что-то вроде этого:...

Dipayan / 24 апреля 2018

0 голосов

0 ответов

Spark-Xml: Массив в массиве в Dataframe для генерации XML

У меня есть требование для создания XML, который имеет структуру ниже <parent>...

Punith Raj / 24 апреля 2018

0 голосов

1 ответ

DataFrame записывает в 10 раз медленнее, чем RDD, сохраняет в Cassandra в искре

Я попытался сравнить cassandra save для таблицы с 30 000 записей для RDD и DataSet.Я обнаружил, что...

Shrinivas Suresh / 24 апреля 2018

0 голосов

1 ответ

Невозможно пройти через Spark RDD

Я хочу перебрать RDD в Spark Repl, но, похоже, он не работает case class Person(age: Long, name:...

Srinivas / 24 апреля 2018

0 голосов

1 ответ

ExceptionInInitializerError Spark Streaming Kafka

Я пытаюсь подключить Spark Streaming к Kafka в простом приложении. Я создал это приложение на...

Cassie / 24 апреля 2018

0 голосов

2 ответов

Перезаписать только некоторые разделы в многораздельном наборе данных spark

Как мы можем перезаписать многораздельный набор данных, но только те разделы, которые мы собираемся...

Madhava Carrillo / 24 апреля 2018

0 голосов

1 ответ

Усечь таблицу Куду с помощью Spark

Как лучше всего обрезать таблицу куду от спарк? Есть ли какой-нибудь аналог SQL "TRUNCATE...

Vladimir Kravets / 24 апреля 2018

0 голосов

3 ответов

Почему Spark Analyzer сообщает «Связанные скалярные подзапросы должны быть агрегированы» в случае?

Тест, использующий spark-sql, не выполнен из-за следующей ошибки: Коррелированные скалярные...

AJwr / 24 апреля 2018

0 голосов

2 ответов

Образец искры слишком медленный

Я пытаюсь выполнить простую случайную выборку с помощью Scala из существующей таблицы, содержащей...

fmv1992 / 24 апреля 2018

0 голосов

3 ответов

Лучшая практика для написания в hadoop от spark

Я просматривал некоторый код, написанный коллегой, и нашел метод, подобный этому: def writeFile(df:...

user3685285 / 24 апреля 2018

0 голосов

1 ответ

DSE Spark Streaming: длинная очередь активных пакетов

У меня есть следующий код: val conf = new SparkConf() .setAppName("KafkaReceiver")

jAi / 24 апреля 2018

0 голосов

2 ответов

Результаты страницы Apache Spark или просмотреть результаты для больших наборов данных

Я использую Hive с Spark 1.6.3 У меня большой набор данных (40000 строк, 20 столбцов или около того...

andrew.butkus / 24 апреля 2018

0 голосов

1 ответ

Как использовать Spark SQL в качестве базы данных в памяти?

Я пытаюсь понять концепции Spark SQL и мне интересно, могу ли я использовать Spark SQL в качестве...

kumar / 24 апреля 2018

79 голосов

8 ответов

Как предотвратить java.lang.OutOfMemoryError: пространство PermGen при компиляции Scala?

Я заметил странное поведение моего компилятора scala. Иногда он генерирует OutOfMemoryError при...

BumbleGee / 30 ноября 2011