Вопросы с тегом апаша-искра

3 голосов

1 ответ

Как исправить проблемы с соединением при отправке тяжелых файлов в таблицу улья

У меня есть файлы в формате hdf, которые я хочу поместить в таблицу Hive.Операция выполняется...

Mathias L. / 31 мая 2019

0 голосов

0 ответов

начало сеанса зажигания в течение R

Я могу успешно запустить сеанс spark, используя команду sparkR в SPARK_PATH.Но это действительно...

Woody / 31 мая 2019

2 голосов

1 ответ

Hadoop FileUtils не может записывать файлы в локальную (Unix) файловую систему из Scala

Я пытаюсь записать файл в локальный FileSystem, используя библиотеку FileSystem org.apache.hadoop

knowone / 31 мая 2019

1 голос

0 ответов

Spark - ПРЕДУПРЕЖДЕНИЕ HDFSBackedStateStoreProvider: состояние для версии 1 не существует в загруженных картах

В настоящее время я работаю над заданием Spark Structured Streaming, и кажется, что на каждом...

taylorcressy / 31 мая 2019

0 голосов

1 ответ

Используйте Case Apache Spark, получая Nameerror, запускающую строку с countryCodeMap

Я очень новичок в этом, и я использую пример использования, найденный на databricks.com, чтобы...

Reddress / 31 мая 2019

1 голос

1 ответ

Как подключиться к Apache spark / hadoop из VBA

Я знаком с SQL (особенно postgres) и VBA, но на стороне искры Apache, я новичок, но кажется, что он...

Gin / 30 мая 2019

0 голосов

1 ответ

Когда PySpark записывает фрейм данных в json, я получаю пустой каталог, почему?

Я пытаюсь записать содержимое кадра данных на диск таким образом, чтобы каждая строка представляла...

LaserJesus / 30 мая 2019

0 голосов

0 ответов

Почему не удается правильно загрузить сохраненную локальную модель LDA в среде искры?

Я изучал и реализовывал функции spark mlib и не могу загрузить сохраненную модель lda. Я работаю с...

PeterSager / 30 мая 2019

0 голосов

2 ответов

Не удалось найти источник данных: воспламенить

У меня есть три узла искрового кластера и три узла воспламеняющего кластера. Версия Spark: 2.3...

Sam / 30 мая 2019

0 голосов

2 ответов

Spark: агрегация с динамическим фильтром на фрейме данных в Scala

У меня есть такой фрейм данных, как scala> testDf.show()...

sproutee / 30 мая 2019

0 голосов

1 ответ

Искра вызвана: java.lang.StackOverflowError Функция окна?

Я столкнулся с ошибкой, вызванной оконной функцией. Когда я применяю этот сценарий и сохраняю...

thePurplePython / 30 мая 2019

1 голос

0 ответов

Pyspark: ошибка при уменьшении по ключу; IndexError: строковый индекс вне диапазона

Ниже мой код для rdd: temp_var = temp_var.map(lambda x: (x[0], ((x[1][2]*x[1][3])+ x[1][0],x[1]...

Naveen Gabriel / 29 мая 2019

1 голос

1 ответ

Невозможно преобразовать набор данных Spark в Iterator с помощью встроенного в toLocalIterator ()

Я пытаюсь преобразовать набор данных искры в итератор, чтобы записать набор данных в influenxdb

Pakfaiwong / 29 мая 2019

0 голосов

2 ответов

Как перебрать столбцы «искрового» фрейма данных?

У меня есть следующий фрейм данных Spark, который создается динамически |имя |число | + -------- +...

kalpana / 29 мая 2019

1 голос

1 ответ

Я сохраняю DataFrame в Hbase и получаю: java.lang.NoClassDefFoundError: org / apache / hadoop / hbase / client / TableDescriptor

Я создал проект на Apache Spark. Версия: scala 2.11.8 apache spark 2.3.0 apache hbase 1.2.0...

Dumitru Preguza / 29 мая 2019

1 голос

1 ответ

PySpark: как добавить фреймы данных в цикл For

Я выполняю скользящее среднее вычисление для отдельных временных рядов временных рядов, затем хочу...

mwhee / 29 мая 2019

0 голосов

1 ответ

NullPointerException при преобразовании сопоставленных данных в DataFrame

Я пишу искровое приложение, которое берет данные транзакций из Hive и соединяет их с данными о...

Kok-Lim Wong / 29 мая 2019

0 голосов

1 ответ

выбрать из первых вхождений до последних значений в столбце массива в pyspark df

У меня есть проблема, в которой приходится искать первое вхождение «Employee_ID» в...

DeepanKar Sehdev / 29 мая 2019

0 голосов

0 ответов

Требуется ли модернизация искры для модернизации банок Tibco?

Я работаю над сервисом потокового воспроизведения, который читает транзакции из каталога hdfs и...

Gaurav Gupta / 29 мая 2019

1 голос

0 ответов

Как исправить ошибку «пользователю root (идентификатор пользователя 0) было отказано в доступе для создания application_1558587698997_88549» при запуске спаркджоба на сервере?

У меня есть работа spark, где я читаю данные из нескольких файлов hadoop и записываю их в таблицу...

Dookoto_Sea / 29 мая 2019

0 голосов

1 ответ

Найти идентификаторы изолированных вершин с помощью графического фрейма

Как лучше всего найти идентификаторы изолированных вершин с помощью GraphFrame?В последней версии...

Sumit Purohit / 29 мая 2019

0 голосов

1 ответ

Сколько стручков Spark Executor вы запускаете на узел Kubernetes

Spark требуется много ресурсов для выполнения своей работы.Kubernetes - отличная среда для...

hnajafi / 28 мая 2019

0 голосов

1 ответ

Spark Dataframe - Как манипулировать строками с вложенной структурой на них?

У меня есть искра DataFrame, подобная этой:...

bbbbz / 28 мая 2019

0 голосов

0 ответов

Чтение плохих имен gzipped json-файлов для разжигания датафрейма

Я перевожу искровую работу в Amazon EMR и хочу прочитать сжатые файлы json из S3 в искровом фрейме...

jaspreet kaur bassan / 28 мая 2019

3 голосов

1 ответ

Spark ML_pipelines: управление чтением таблиц

Я использую Spark ML_pipelines для простого развертывания операций, которые я разработал в Sparklyr...

Vincent / 28 мая 2019