Вопросы с тегом апаш-искра - PullRequest

Вопросы с тегом апаш-искра

0 голосов
0 ответов

У меня есть настройка кластера с одним драйвером и двумя исполнителями, работающими в режиме пряжи

Girish Gupta / 10 февраля 2019
0 голосов
0 ответов

Мои искры. Фреймы данных импортируются из файлов паркета в ADLS.Есть ли способ найти дату...

Dan / 10 февраля 2019
0 голосов
2 ответов

Как вы интерполируете фрейм данных PySpark в сгруппированные данные? Например: У меня есть фрейм...

penguin / 10 февраля 2019
0 голосов
1 ответ

Мне нужно отфильтровать СДР по результату сопоставления.Первоначально у меня есть СДР диагноза:...

Ekaterina Tcareva / 09 февраля 2019
0 голосов
2 ответов

У меня есть следующая таблица DEST_COUNTRY_NAME ORIGIN_COUNTRY_NAME count United States Romania 15...

Manu Chadha / 09 февраля 2019
0 голосов
2 ответов

Какие могут быть полезные случаи использования метода reduce в Dataset. У меня есть следующая...

Manu Chadha / 09 февраля 2019
0 голосов
2 ответов

У меня есть фрейм данных dataframe_actions с полями: user_id, action, day.user_id уникален для...

Qubix / 09 февраля 2019
0 голосов
1 ответ

Я предлагаю неплохо обработать огромную таблицу JDBC, читая строки партиями и обрабатывая их с...

Aleks Ya / 09 февраля 2019
0 голосов
1 ответ

У меня есть следующая таблица: DEST_COUNTRY_NAME ORIGIN_COUNTRY_NAME count United States Romania 15...

Manu Chadha / 09 февраля 2019
0 голосов
1 ответ

Я недавно прочитал эту статью и опробовал пример, но когда я запускаю val usersDF = spark.read

Achilleus / 09 февраля 2019
0 голосов
0 ответов

Этот пост о том, как неэффективно спарк присоединение таблицы с подзапросом с использованием той же...

Doug T / 09 февраля 2019
0 голосов
0 ответов

У меня одно недоразумение по поводу документов Spark Structured Streaming.Я прочитал это много раз

user3672628 / 08 февраля 2019
0 голосов
0 ответов

У меня есть фрейм данных с миллиардами записей.У меня есть несколько строковых столбцов, которые...

parasu / 08 февраля 2019
0 голосов
2 ответов

У меня есть задания Spark в EMR, и EMR настроен на использование каталога Glue для метаданных Hive...

wrschneider / 08 февраля 2019
0 голосов
1 ответ

Мне нужно запустить скрипт python на экземпляре EMR, используя pyspark для запроса DynamoDB.Я могу...

Chinmaya B / 08 февраля 2019
0 голосов
0 ответов

Мой код использует класс StreamingKMeans для кластеризации потоковых данных из kafka.Я хочу...

andrea5 / 08 февраля 2019
0 голосов
1 ответ

Я хочу прочитать сообщение из темы Кафки в моей работе Spark Structured Streaming во фрейм данных

Atanu chatterjee / 08 февраля 2019
0 голосов
1 ответ

Запуск кластера CDH 5.14.4 вместе с CDS Spark 2.3 Release 4.При отправке довольно большого задания...

Guru / 08 февраля 2019
0 голосов
1 ответ

Я создал RDD из Graphx, который выглядит следующим образом: val graph = GraphLoader

Aamir / 08 февраля 2019
0 голосов
1 ответ

Я пытаюсь добиться вывода значений для определенных столбцов DataFrame с учетом значений каждой...

Lenny D. / 08 февраля 2019
0 голосов
2 ответов

Я задаю этот вопрос, потому что, если я укажу перераспределение как 5, тогда все мои данные (>...

Arun / 08 февраля 2019
0 голосов
1 ответ

У меня есть следующая таблица: DEST_COUNTRY_NAME ORIGIN_COUNTRY_NAME count United States Romania 15...

Manu Chadha / 08 февраля 2019
0 голосов
1 ответ

Я изучаю pyspark.Итак, вот как я создаю среду: 1. ubuntu in virtual machine 2. downloading spark 2

Feng Chen / 08 февраля 2019
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...