Вопросы с тегом апаш-искра - PullRequest

Вопросы с тегом апаш-искра

0 голосов
2 ответов

Чем spark2-submit отличается от spark submit. Мне нужно перенести код из spark 1.6 to spark 2.4...

techie / 17 января 2019
0 голосов
0 ответов

У меня есть огромные данные, которые накапливаются каждый год ежеквартально.Эти данные немного...

Shyam / 17 января 2019
0 голосов
0 ответов

Мне интересно, сталкивался ли кто-либо из вас с такой же проблемой. В основном я выполняю некоторые...

Tomasz Krol / 17 января 2019
0 голосов
1 ответ

Я читаю паркетный файл в spark-scala и занимаюсь вычислениями и фильтрацией. Я хочу проглотить...

DarKnight / 17 января 2019
0 голосов
1 ответ

Я новичок в Spark Framework и мне нужен совет. У меня такая структура папок. reports - 20180101 -...

Nurzhan Nogerbek / 17 января 2019
0 голосов
0 ответов
0 голосов
0 ответов

У меня есть сценарий от производителя консоли, я создал 4 сообщения, и с помощью spark я смог...

Pankaj Mishra / 17 января 2019
0 голосов
1 ответ

OrderNo Status1 Status2 Status3 123 Completed Pending Pending 456 Rejected Completed Completed 789...

Ansip / 17 января 2019
0 голосов
2 ответов

У меня есть фрейм данных pyspark со следующим форматом времени 20190111-08:15:45.275753. Я хочу...

CodeGeek123 / 17 января 2019
0 голосов
1 ответ

Я сохраняю dataFrame, и в интерфейсе spark я вижу, что этот dataframe разделен на мои 7 узлов. В...

user1361815 / 17 января 2019
0 голосов
1 ответ

У меня есть код задания зажигания как показано ниже Который отлично работает с приведенной ниже...

Rohan Lopes / 17 января 2019
0 голосов
0 ответов

У меня есть искровое задание, которое получает данные из таблицы в SQL Server и генерирует...

guru107 / 17 января 2019
0 голосов
1 ответ

У меня есть датафрейм, как показано ниже. ID, details_Json 1 {"name":"Anne"...

CRV / 17 января 2019
0 голосов
0 ответов

В функции evictBlocksToFreeSpace указано: Попробуйте выселить блоки, чтобы освободить определенное...

chenzhongpu / 17 января 2019
0 голосов
1 ответ

Например, если в драйвере Spark запущен следующий код: rdd.foreachPartition(iterator =>...

Aether / 17 января 2019
0 голосов
1 ответ

Я очень новичок в PySpark. Я собирал tfidf и хочу сохранить его на диске в качестве промежуточного...

lU5er / 16 января 2019
0 голосов
1 ответ

У меня есть еще один вопрос о Spark и Scala. Я хочу использовать эту технологию для получения...

THIBAULT Nicolas / 16 января 2019
0 голосов
1 ответ

У меня есть сценарий использования для генерации суррогатного ключа (уникального и с приращением 1)...

AKC / 16 января 2019
0 голосов
0 ответов

Я установил Hadoop версии 2.8.3 в моей среде Windows 10 (псевдораспределенный режим), и она...

Anubhav Jain / 16 января 2019
0 голосов
1 ответ

В моей программе Scala я сталкиваюсь с проблемой объединения результатов нескольких уровней GroupBy

Priyesh Chhabra / 16 января 2019
0 голосов
3 ответов

У меня есть требование соединить 50 нечетных файлов на наборе из 3 ключей, используя кадры данных...

BeeBeeGee / 16 января 2019
0 голосов
1 ответ

Я работаю над проектом прогнозирования ссылок в Spark, используя Scala. Моя цель состоит в том,...

Valentina / 16 января 2019
0 голосов
1 ответ

Озеро данных, с которым я работаю (df), имеет 2 ТБ данных и 20 000 файлов. Я хотел бы сжать набор...

Powers / 16 января 2019
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...