Вопросы с тегом апаша-искра - PullRequest

Вопросы с тегом апаша-искра

0 голосов
1 ответ

Я использую 10 r4.8xlarge с 32 кодами и 244 ГБ памяти и 100 ГБ SSD, мой ввод составляет 100 22 ГБ...

user10714010 / 29 сентября 2019
1 голос
0 ответов

Я могу подключиться к Vertica через EMR (Spark), подсчитать и распечатать схему, но не могу...

g1_ / 29 сентября 2019
0 голосов
1 ответ

Я хотел бы передать набор файлов avro в качестве входных данных в работу Spark и создать фрейм...

Ameer basha Pathan / 28 сентября 2019
0 голосов
0 ответов

У меня более двух заданий scala, которые выполняются одновременно и пишут в одно и то же место. Я...

user8617180 / 28 сентября 2019
0 голосов
1 ответ

Нужно искать слово или число в папке, которая содержит 100 CSV-файлов, используя scala и spark

Ayush / 28 сентября 2019
0 голосов
1 ответ

Здравствуйте. Я пытаюсь расширить последнее значение каждого окна до остальной части окна для...

Javier de la Iglesia / 28 сентября 2019
0 голосов
2 ответов

Я пытаюсь понять, как aggregateByKey работает в искре В приведенном ниже примере преобразовывается...

user10714010 / 28 сентября 2019
0 голосов
0 ответов

Я использую pyspark spark 2.4.4 и Pycharm Python: 2.7 Пожалуйста, помогите мне, как мне настроить...

Sophie Dinka / 28 сентября 2019
0 голосов
1 ответ

При чтении документации Spark DataType BigDecimal (точность, масштаб) означает, что Точность - это...

ibaralf / 28 сентября 2019
0 голосов
1 ответ

Я извлекаю около 10 миллионов записей из оракуловой базы данных и пытаюсь сохранить их на графике...

Sruthi / 27 сентября 2019
2 голосов
0 ответов

Я хочу продолжать обновлять таблицу mysql с некоторыми агрегированными результатами, которые я...

mohit_d / 27 сентября 2019
1 голос
2 ответов

У меня проблемы с обновлением / переконфигурированием предопределенного контекста Spark,...

Elliot Huebler / 27 сентября 2019
0 голосов
0 ответов

Я пытался следовать UDAF без scala z для расчета режима столбца, но он возвращает Null:...

Saad Zia / 27 сентября 2019
0 голосов
3 ответов

Я пытаюсь сгруппировать фрейм данных, затем при агрегировании строк с количеством я хочу применить...

aName / 27 сентября 2019
1 голос
1 ответ

Из этого данного XML я хотел бы извлечь значения для тега и назначить их переменной.Я использую...

earl / 27 сентября 2019
0 голосов
1 ответ

Я пытаюсь запустить простую программу подсчета слов с spark-submit и получаю исключение. Исключение...

user1575148 / 27 сентября 2019
0 голосов
0 ответов

Я хочу создать локальную искровую среду в Intellij для разработки / тестирования приложения Spark,...

user2037661 / 27 сентября 2019
0 голосов
2 ответов

У меня есть фрейм данных, который имеет два столбца с одинаковыми именами, так как первый столбец...

Yonas Haile / 27 сентября 2019
1 голос
1 ответ

Я пытаюсь заставить sparklyr работать на кластере с Hadoop.Когда я запускаю sc <-...

Merik / 27 сентября 2019
0 голосов
0 ответов

Например, у меня есть фрейм данных с разной длиной не вложенного json: и для каждого json у меня...

Mark Krystal / 27 сентября 2019
0 голосов
0 ответов

Я использую newAPIHadoopRDD для чтения всех данных из HBase.Это неэффективно, так как я читаю все...

Ani / 27 сентября 2019
1 голос
2 ответов

Я пытаюсь отфильтровать фрейм данных в scala, сравнив два его столбца (в данном случае тему и...

C K / 26 сентября 2019
0 голосов
1 ответ

Я использую PySpark для чтения каждый день CSV-файла, который называется что-то вроде AA_...

WorkBench / 26 сентября 2019
0 голосов
0 ответов

Я новичок в Spark и пытаюсь загрузить CSV-файл в BigQuery с помощью spark при настройке ошибки...

Ram G / 26 сентября 2019
0 голосов
2 ответов

В Spark 1.6, в основном, я хотел бы применить разделение, а затем упорядочить, используя два...

Surender Raja / 26 сентября 2019
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...