Вопросы с тегом апаша-искра

0 голосов

0 ответов

искра-отправка пряжи java.lang.ClassNotFoundException: com.microsoft.sqlserver.jdbc.SQLServerDriver

spark-submit --master yarn --deploy-mode cluster sqlserver.py --jars sqljdbc42.jar Я получаю...

vishal / 23 мая 2018

0 голосов

1 ответ

ошибка доступа к файлу при запуске искры на kubernetes

Я следовал за Spark в блоге Kubernetes , но дошел до того, что он запускает задание, но не работает...

Ben / 23 мая 2018

0 голосов

1 ответ

OutOfMemoryError: пространство кучи Java в Spark

У меня проблемы с памятью, но я не могу ее решить.Любая помощь высоко ценится.Я новичок в...

Jenny / 22 мая 2018

0 голосов

3 ответов

Spark Dataframe должен быть перераспределен после фильтра, как RDD?

В соответствии с таким количеством хороших ресурсов, желательно переразбить RDD после работы...

Mayank Mittal / 22 мая 2018

0 голосов

2 ответов

Spark - передать полную строку в udf, а затем получить имя столбца внутри udf

Я использую Spark со Scala и хочу передать всю строку в udf и выбрать для каждого имени столбца и...

user1122 / 22 мая 2018

0 голосов

0 ответов

Вызов директории .hql из spark

Я пытался запустить hql-файлы, как показано ниже, но получаю сообщение об ошибке...

hival / 22 мая 2018

0 голосов

0 ответов

PySpark перезапустить SparkContext в случае сбоя

Мне нужно вычислить несколько агрегатов для каждой таблицы в базе данных Hive.Мой код выглядит...

sergionsk8 / 22 мая 2018

0 голосов

0 ответов

Искра водитель выселения Кубернетес

Каков будет рекомендуемый подход, чтобы дождаться, пока модуль искрового драйвера завершит текущее...

shiv455 / 22 мая 2018

0 голосов

1 ответ

Pyspark: spark-submit не работает как CLI

У меня есть pyspark для загрузки данных из файла TSV и сохранения его в виде файла паркета, а также...

Mikhail Venkov / 22 мая 2018

0 голосов

1 ответ

Отправка скрипта Python с помощью API-интерфейса Apache Spark Hidden REST

Мне нужно отправить файл py с API Apache Spark Hidden REST. Как я следовал учебнику arturmkrtchyan ...

Mahsa Pourjafarian / 22 мая 2018

0 голосов

1 ответ

как преобразовать org.apache.spark.sql.DataFrame с одной строкой и одним столбцом в целочисленное значение

рассмотрите возможность запроса данных улья изнутри искры, используя val selectMemCntQry =...

pooja / 22 мая 2018

0 голосов

2 ответов

Объединение строк в искровом скале

Объединить строки в искровом кадре данных У меня есть данные, подобные следующим ID Name Passport...

Darshan Shah / 22 мая 2018

0 голосов

3 ответов

Соберитесь в sparklyr

Я использую sparklyr для манипулирования некоторыми данными.Учитывая, a<-tibble(id = rep(c(1,10)...

RPisco / 22 мая 2018

0 голосов

1 ответ

как получить доступ к значениям карты и ключам, хранящимся во фрейме данных в Scala Spark

У меня есть таблица, описание которой выглядит следующим образом: # col_name data_type comment id...

Romal Jaiswal / 22 мая 2018

0 голосов

1 ответ

Spark: измерение производительности UDF для большого набора данных

Я хочу измерить производительность udf на большом наборе данных.SQL искры: spark.sql("SELECT...

beginner_ / 21 мая 2018

0 голосов

1 ответ

Работа Spark никогда не переходит из состояния ACCEPTED и зависает со статусом UNDEFINED.

У меня есть простой кластер Hadoop, состоящий из одного главного узла и двух подчиненных узлов.Я...

Aesir / 21 мая 2018

0 голосов

0 ответов

R: Nan после числовой.извлекать числа из строки с помощью stringr, но она показывает Nan.dplyr, sparklyr, труба

Я начал использовать sparklyr для обработки данных большого размера, поэтому мне нужно использовать...

Alice Shin / 21 мая 2018

0 голосов

1 ответ

Ошибка записи файла ORC из искры в hadoop

Я делаю проект для школы на предоставленном небольшом кластере (4 узла, 1 - это namenode и spark...

beginner_ / 21 мая 2018

0 голосов

1 ответ

Почему почти постоянное время выполнения при увеличении рабочих Spark автономно

Мне говорят, что рекомендуемое количество рабочих для установки - одно на ядро при использовании...

Arnold Taremwa / 21 мая 2018

0 голосов

1 ответ

Spark - JSON пустой массив строк отображается как строка

Я пытаюсь загрузить данные нескольких файлов JSON в HIVE, используя spark-shell и Scala. import org

Neha / 21 мая 2018

0 голосов

1 ответ

Как создать выражение когда в искре с петлями

Привет У меня есть требование к созданию столбца на основе нескольких , когда операторов. df

John / 21 мая 2018

0 голосов

1 ответ

Есть ли какая-нибудь функция udf для add_months в scala

Можете ли вы помочь, если в scala есть какой-либо udf, эквивалентный add_months в sql....

user2672739 / 21 мая 2018

0 голосов

3 ответов

Отображение различных интервалов значений столбца в целые числа

У меня есть датафрейм в Spark: customer | age -------------------- A 25 B 17 C 8 , где столбец...

Dipanjan Das / 21 мая 2018

0 голосов

1 ответ

формируя новые столбцы в виде одного горячего вектора

У меня есть фрейм данных: customer | Department ---------------------- A | Food B | Home A | Office...

Dipanjan Das / 21 мая 2018

0 голосов

2 ответов

выбрать не более 3 первых элементов после разделения

у меня в кадре есть датафрейм: Col_A | Col_B -------------- A | 1,6,5,3,7 B | 17,18,78 C | 90 D |...

Dipanjan Das / 21 мая 2018