Вопросы с тегом апаш-искра - PullRequest

Вопросы с тегом апаш-искра

0 голосов
1 ответ

В настоящее время мы используем приложение на основе Spark 2.1, которое анализирует и обрабатывает...

Tapan / 15 декабря 2018
0 голосов
0 ответов

Пакет рекомендаций pyspark ml включает реализацию ALS, основанную на статье Ху, Корена и...

recondite_information / 15 декабря 2018
0 голосов
1 ответ

У меня есть фрейм данных с двумя столбцами, где в каждой строке есть разреженный вектор.Я пытаюсь...

Tasos / 15 декабря 2018
0 голосов
1 ответ

Я знаю, что в scala существует способ, как упомянуто ниже. val joined_df = df1.join(broadcast(df2),...

Shashank V C / 15 декабря 2018
0 голосов
1 ответ

Я хочу добавить столбец прогноза в свой набор данных после того, как я использовал алгоритм Kmeans...

itgtzortz / 15 декабря 2018
0 голосов
0 ответов

при отправке следующего кода в кластер со следующей конфигурацией: мы используем двухузловой...

BalaKumar / 15 декабря 2018
0 голосов
2 ответов

Я использую spark 2.0.1, df.show() +--------+------+---+-----+-----+----+...

Jeevan / 15 декабря 2018
0 голосов
1 ответ

Данные - Данные по обучению и тестированию, которые у меня есть, очень велики по размеру ~ 150 ГБ и...

gagan malhotra / 15 декабря 2018
0 голосов
2 ответов

У меня есть фрейм данных в scala, который является результатом попарного сравнения всех строк в...

Fincher / 14 декабря 2018
0 голосов
2 ответов

Как spark определяет количество разделов после использования orderBy?Я всегда думал, что...

Raphael Roth / 14 декабря 2018
0 голосов
3 ответов

Мы используем широковещательное хеш-соединение в Spark, когда у нас достаточно одного кадра данных,...

vikrant rana / 14 декабря 2018
0 голосов
3 ответов

Я столкнулся с проблемой, пытаясь преобразовать мой Dataframe в набор данных, чтобы я мог запустить...

itgtzortz / 14 декабря 2018
0 голосов
1 ответ

У меня есть файловая структура в следующей форме...

ecerulm / 14 декабря 2018
0 голосов
1 ответ

У меня есть датафрейм в pyspark, как показано ниже ID Name add date from date end 1 aaa yyyyyy...

user2935539 / 14 декабря 2018
0 голосов
0 ответов

У меня есть настройка Zeppelin, и я пишу некоторые работы в блокноте.Во время их запуска я...

Chris Mejka / 14 декабря 2018
0 голосов
0 ответов

Я пытаюсь запустить две или более работы параллельно.Все задания записывают и дополняют данные,...

Ariel / 14 декабря 2018
0 голосов
0 ответов

мы продолжаем выполнять задания с потоковой передачей, считая, что это месяцы, мы перезапускаем...

Varma / 14 декабря 2018
0 голосов
0 ответов

Я создал кэшированную таблицу через сеанс А через beeline, через который я могу получить доступ к...

jiayp89 / 14 декабря 2018
0 голосов
0 ответов

Я работаю с Apache Spark 2.3 и читаю данные с порта UDP в формате lz0, распаковываю эти данные в...

kalpana / 14 декабря 2018
0 голосов
1 ответ

Я новичок в Airflow и Spark, и я борюсь с SparkSubmitOperator . Наш планировщик воздушного потока и...

V. Foy / 14 декабря 2018
0 голосов
1 ответ
0 голосов
2 ответов

У меня Spark версии 2.4.0 и scala версии 2.11.12.Я могу успешно загрузить фрейм данных с помощью...

user204548 / 14 декабря 2018
0 голосов
1 ответ

Я смотрю на пример книги, похожий на следующий (практически идентичный): >>> from pyspark

NYCeyes / 14 декабря 2018
0 голосов
0 ответов

Я использую Spark / Scala для чтения набора данных xml-файлов, выполнения фильтрации и вывода...

Billy C / 14 декабря 2018
0 голосов
1 ответ

Зависимости включают в себя: com.holdenkarau: spark-testing-bvase_2.10: 1.6.3 org.xerial.snappy:...

kingledion / 14 декабря 2018
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...