Вопросы с тегом апаш-искра

0 голосов

2 ответов

как получить весь элемент из массива массивов столбцов искры dataframe scala

Я работаю с фреймом данных. Df выглядит так: root |-- array(data1, data2, data3, data4): array...

Chaouki / 04 октября 2018

0 голосов

1 ответ

как изменить значение spark.r.backendConnectionTimeout?

Когда я использую R в Zeppelin, он работает, но когда я оставляю Zeppelin включенным один день, на...

scyrt / 04 октября 2018

0 голосов

1 ответ

Spark Streaming Kafka: ClassNotFoundException для ByteArrayDeserializer при запуске с искрой-отправкой

Я новичок в Scala / Spark Streaming и в StackOverflow, поэтому прошу прощения за мое форматирование

Terry Healy / 04 октября 2018

0 голосов

0 ответов

использование трубы в искре на информационном кадре

Я пытаюсь запустить исполняемый скрипт для столбца в кадре данных. В настоящее время Spark...

user7406833 / 04 октября 2018

0 голосов

1 ответ

Есть ли какой-нибудь встроенный метод, чтобы найти оценку сходства между двумя текстовыми файлами в apache spark scala

Я хочу посмотреть, насколько релевантен входящий твит для моей тестовой статьи. У меня есть набор...

CH.Venkata Viswanath / 04 октября 2018

0 голосов

0 ответов

сбой задания с Не удалось создать локальный каталог в / tmp / blockmgr

Я пытался запустить длинное искровое приложение, которое имеет 5 заданий, 4 задания успешно...

user9643342 / 04 октября 2018

0 голосов

2 ответов

Использование pyspark в Windows не работает - py4j

Я установил Zeppelin в Windows, используя это руководство и это .Я также установил Java 8, чтобы...

Shir / 04 октября 2018

0 голосов

3 ответов

Разница между аллуксио (тахион) и вольфрамом в искре?

Tachyon - это распределенная система хранения в памяти, разработанная отдельно от Spark, которая...

Michael / 04 октября 2018

0 голосов

0 ответов

Оболочка Spark с использованием combByKey с Object?

Я создал простой набор данных, найдя average.Нашел способ используя tuple с опцией combineByKey

Learn Hadoop / 04 октября 2018

0 голосов

3 ответов

Spark: вернуть пустой столбец, если столбец не существует в кадре данных

Как показано в приведенном ниже коде, я считываю файл JSON в фрейм данных и затем выбираю некоторые...

AntonyP / 04 октября 2018

0 голосов

1 ответ

Как пропустить несколько строк, используя read.csv в PySpark

У меня .csv с несколькими столбцами, и я хочу пропустить 4 (или 'n' в целом) строки при...

cph_sto / 04 октября 2018

0 голосов

0 ответов

Как выбрать столбцы в датафрейме с кавычками в имени в спарк

Я пытался получить доступ к столбцам "accession" "database" "disease"...

gaurhari dass / 04 октября 2018

0 голосов

2 ответов

Spark & Scala: как заменить значения в Dataframes в разных столбцах

У меня есть эти dataFrames: +----+-------+-----------+...+------+----------------+---------+ |mot1|...

YAGOUBI Djamel Edine / 04 октября 2018

0 голосов

2 ответов

Загружает ли файлы в память переименование файлов S3 в spark?

Я задаю этот вопрос, потому что мое переименование S3 файлов, которые я генерирую с помощью spark,...

Anupam / 04 октября 2018

0 голосов

1 ответ

Групповые искробезопасные агрегаты по нескольким клавишам

В приведенном ниже фрагменте вторая агрегация завершается неудачно (что неудивительно): java.lang

Ivan Balashov / 04 октября 2018

0 голосов

0 ответов

Spark CSV GZip для паркета?

Я использую Spark 2.3.1 PySpark (AWS EMR) Я получаю ошибки памяти: Контейнер уничтожен YARN за...

Acid Rider / 04 октября 2018

0 голосов

2 ответов

Spark Sql - Ошибка вставки во внешнюю таблицу улья

Я пытаюсь вставить данные во внешнюю таблицу кустов через spark sql.Мой стол в улье разбит на...

Ayan Biswas / 04 октября 2018

0 голосов

1 ответ

уменьшение по ключу с последующим foreachpartition в искре

Я понимаю, в spark, что редукционный ключ будет сначала уменьшать локально на каждом разделе, а...

Zhang Rui / 04 октября 2018

0 голосов

0 ответов

Как расширить интерпретатор Zeppelin Spark для использования собственной логики создания SparkConf

Интерпретатор Zeppelin Spark создает SparkContext автоматически, однако мне нужно использовать...

devin / 04 октября 2018

0 голосов

0 ответов

Spark Timeout проблема

Я запускаю небольшую программу в кластере Apache Spark и получаю такую ошибку.Это неправильно.Это...

Vineel / 04 октября 2018

0 голосов

1 ответ

Выделить все столбцы во время выполнения spark sql, без предопределенной схемы

Masterbuilder / 04 октября 2018

0 голосов

2 ответов

По заданным часам, месяцу и году конвертируйте его в метку времени в Spark Scala.

У меня есть три столбца - «Год», «Месяц» и «Час».Мне нужны входные данные для преобразования его в...

Deepika Jantz / 03 октября 2018

0 голосов

1 ответ

Обнаружение выбросов в pyspark

У меня есть фрейм данных pyspark, как показано ниже. +---+-------+--------+ |age|balance|duration|...

RSK / 03 октября 2018

0 голосов

1 ответ

Pyspark: \ Anaconda3 \ envs \ xgboost \ python.exe] был неожиданным

Я пытаюсь установить Pyspark в Windows. Я применил setx к следующему: PYSPARK_DRIVER_PYTHON...

Sade / 03 октября 2018

0 голосов

0 ответов

Kryo IndexOutOfBoundsException: индекс: 113, размер: 5

Я использую Kryo 5.0.0-RC1.У меня есть следующее исключение: java.lang.IndexOutOfBoundsException:...

MaatDeamon / 03 октября 2018