Вопросы с тегом апач искра - PullRequest

Вопросы с тегом апач искра

6 голосов
4 ответов

У меня есть: Большой кадр данных (формат паркета, 100 000 000 строк, размер 4,5 ТБ), содержащий...

Ivan Menshikh / 15 мая 2019
0 голосов
0 ответов

Я очень новичок в Apache Spark.Я пытаюсь настроить систему Windows 8.Я сделал следующее: Скачал...

Sumit / 15 мая 2019
0 голосов
0 ответов

У меня есть такой код: .repartition( 10 ) .rdd.mapPartitions( it => MyProcessor.process(it) )

Klun / 13 мая 2019
1 голос
2 ответов

У меня есть список строк типа, который содержит несколько элементов в форме [Cid:0001,Jid:439,java...

Ashwin Thomas / 13 мая 2019
1 голос
1 ответ

Я пытаюсь запустить этот пример Spark в InteliJ. Однако компилятор жалуется на ключевое слово...

Alon / 13 мая 2019
0 голосов
1 ответ

Я пытаюсь запустить основной класс в проекте scala-sbt.Запуск класса приводит к ошибке...

Pavan_Obj / 09 мая 2019
0 голосов
1 ответ

У меня есть база данных MySQL с ~ 20M записями (и растущими), распределенными в некоторых таблицах

invalid_address / 08 мая 2019
2 голосов
1 ответ

У меня есть кейс класса final case class FieldStateData( job_id: String = null, job_base_step_id:...

Brian Yeh / 07 мая 2019
1 голос
1 ответ

Я пытаюсь получить последний файл из s3 за последние 10 дней, когда на входе нет файла.Проблема в...

user3407267 / 07 мая 2019
0 голосов
1 ответ

Я пытаюсь прочитать файл, используя spark.sparkContext.textFile. Файл в кодировке Юникод. когда я...

senthilnathan / 06 мая 2019
0 голосов
1 ответ

У меня есть этот скрипт PySpark: from pyspark.sql import HiveContext from pyspark.sql import...

Miguel A. Friginal / 30 апреля 2019
0 голосов
0 ответов

недавно я пытаюсь применить dbscan-on-spark от https://github.com/irvingc/dbscan-on-spark я...

user1058122 / 30 апреля 2019
0 голосов
1 ответ

Я использую DSE Analytics для анализа данных, 4 сервера EC2 m5ad.xlarge (4 ядра и 16 ГБ ОЗУ, 3...

sontd / 28 апреля 2019
0 голосов
1 ответ

Я пытаюсь прочитать инкрементные данные из моего источника данных, используя Scala-Spark.Прежде чем...

Metadata / 27 апреля 2019
1 голос
0 ответов

Мне нужно перенести данные (включая изображения) из РСУБД в Azure Data Lake путем преобразования в...

Crime_Master_GoGo / 26 апреля 2019
0 голосов
1 ответ

Я пытаюсь использовать DecisionTreeClassifier.train (), но появляется сообщение об ошибке: Ошибка:...

Vincent / 24 апреля 2019
2 голосов
1 ответ

Моя исходная структура данных содержит собственные ссылки, которые не поддерживаются искрой:...

Georg Heiler / 23 апреля 2019
0 голосов
0 ответов

Я пытаюсь установить Apache Ambari на Linux Mint. Установка успешно завершена, но когда я пытаюсь...

sheraz iqbal / 21 апреля 2019
0 голосов
1 ответ

как я могу исключить слова, содержащие цифры, когда делаю это в Scala новейшая версия Scala val...

Shanshan / 19 апреля 2019
0 голосов
0 ответов

У меня есть большая коллекция Mongo, которую я хочу использовать в своем приложении Spark,...

vlyubin / 18 апреля 2019
2 голосов
0 ответов

Мне нужно извлечь содержимое зашифрованного CSV-файла (включая заголовок) в набор данных. Каков...

Pranav / 13 апреля 2019
0 голосов
1 ответ

Я работаю над проектом Scala / Spark, я хотел бы экспортировать свой проект в файл jar и запустить...

Ahmed Radhwen Khadhri / 12 апреля 2019
1 голос
1 ответ

Я хочу настроить свой искровой кластер на AWS EMR, и я не могу изменить значение по умолчанию spark

yassidhbi / 11 апреля 2019
0 голосов
0 ответов

Я новичок в Spark Scala и запускаю код на кластере EMR.Мои данные содержат как категориальные, так...

Neda Ebrahimi / 11 апреля 2019
0 голосов
0 ответов

Я конвертирую один формат данных в другой.Во время этого преобразования мне нужно проанализировать...

jk1 / 11 апреля 2019
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...