Вопросы с тегом апач-искровой - PullRequest

Вопросы с тегом апач-искровой

0 голосов
1 ответ

Здравствуйте, я хочу иметь дело с большим объемом данных в 1 миллиард строк и 23 столбца. Но в...

Miguel A. Friginal / 23 октября 2019
2 голосов
1 ответ

У меня есть кадр данных, содержащий следующие 3 столбца: 1. ID 2. метка времени 3. IP_Address...

Absurdist_VT / 26 сентября 2019
0 голосов
0 ответов

Я пишу японский символ в таблице улья как часть одной из моих программ.Позже, когда я выбираю это...

Dev2019 / 10 июля 2019
1 голос
2 ответов

Я пишу скрипт Scala Spark, в котором я храню (разделы Hive) пути HDFS в качестве ключей, а их...

Ashwin Ajmera / 21 июня 2019
0 голосов
0 ответов

Я хочу создать среду разработки для запуска приложения Spark, написанного на Scala, для конечной...

datahack / 14 июня 2019
0 голосов
2 ответов

Я строю локоть метод, чтобы найти подходящее число кластера KMean, когда я использую Python и...

Ali / 30 мая 2019
0 голосов
1 ответ

когда я запускаю код с pyspark в Apache Zeppelin 0.8.1, я получаю сообщение об ошибке типа java

LSS / 26 мая 2019
1 голос
1 ответ
0 голосов
0 ответов

Я пытаюсь загрузить XML-файлы из соединения S3 в задании AWS Glue ETL.Файлы загружаются «правильно»...

Zach / 14 мая 2019
1 голос
2 ответов

Допустим, у меня есть следующий искровой фрейм данных (df): Как видно, в «метке времени» есть...

M. Mate / 10 мая 2019
1 голос
0 ответов

Я пытаюсь запустить свой код Spark, который я написал в Intellij, и запустить его на Databricks,...

I.Chorfi / 28 марта 2019
0 голосов
0 ответов

Я пытаюсь использовать инструмент AWS Glue ETL для анализа файла CSV в Parquet. Я следую этому...

Giiovanna / 27 марта 2019
1 голос
1 ответ

Я могу успешно проверить приведенный ниже код в кластере EMR с помощью искры. Но я не могу написать...

Rohan Nayak / 27 марта 2019
0 голосов
0 ответов

Я работал с обычным искровым приложением wordcount на Databricks.Чтобы использовать вспомогательную...

Anurag Kumar Pandey / 26 марта 2019
0 голосов
0 ответов

Я пытался добавить код Spark в существующий файл паркета, но приложение не работает.Вместо этого...

Suresh M N / 14 марта 2019
2 голосов
1 ответ

Выпуск В EMR 5.21 интеграция Spark - Hbase не работает. df.write.options (). Format (). Save ()...

Raj Kumar Rai / 08 марта 2019
0 голосов
1 ответ

Я добавляю файл metrics.properties в каталог ресурсов (проект maven) с CSV sinc.Все нормально,...

jk1 / 01 марта 2019
0 голосов
0 ответов

Я пишу Kinesis Consumer, который читает и расшифровывает приведенные ниже сообщения. Это мой...

Manoj Kumar Dhakd / 15 февраля 2019
0 голосов
2 ответов

В PySpark вы можете определить схему и прочитать источники данных с помощью этой предварительно...

Hauke Mallow / 03 февраля 2019
0 голосов
1 ответ

Я могу успешно загрузить текстовый файл в DataFrame с помощью следующего кода Apache Spark Scala:...

alexanoid / 30 января 2019
0 голосов
1 ответ

У меня есть искровое приложение, которое использует не так часто меняющиеся справочные данные. эти...

anuchadal / 14 января 2019
0 голосов
0 ответов
0 голосов
0 ответов

Я пытаюсь запустить искровое задание в кластере EKS, заставляя его создать 5 рабочих узлов для...

Kalyan Ranjan Parajuli / 14 декабря 2018
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...