Вопросы с тегом апач искра - PullRequest

Вопросы с тегом апач искра

0 голосов
0 ответов

Я работаю над проблемой классификации текста в python с использованием sklearn .Я создал модель и...

Sam / 01 июня 2018
0 голосов
0 ответов

Я проводил некоторые тесты с Pyspark и наткнулся на странную вещь - исполнители Spark, кажется,...

Vyacheslav Zotov / 31 мая 2018
0 голосов
0 ответов

Я пытаюсь определить схему при загрузке файла csv в мой SQLContext с использованием SparkSession

CodeHunter / 29 мая 2018
0 голосов
1 ответ

У меня 6 столов в улье.Я объединяю эти таблицы с предстоящими данными потока Кафки, используя...

lucy / 29 мая 2018
0 голосов
1 ответ

При открытии и проекте IntelliJ Idea как Maven. Когда я import scala.io.Source, проблем нет. Однако...

Foxlooo / 28 мая 2018
0 голосов
1 ответ

Вот код, который я пытаюсь выполнить: SimpleApp.scala package test import java.sql.DriverManager...

Steven / 28 мая 2018
0 голосов
1 ответ

У меня есть следующая таблица Cassandra: CREATE TABLE myflights.flights_by_airport2 ( origin text,...

I Singh / 28 мая 2018
0 голосов
1 ответ

У меня есть некоторые данные, по которым я хочу изучить «нормальное» поведение. Используя...

Nakeuh / 22 мая 2018
0 голосов
1 ответ

У меня следующий проект в IntelliJ, проблема в том, что Subscribe внутри KafkaUtils

Asier Gomez / 22 мая 2018
0 голосов
1 ответ

Я пытаюсь запустить задание Spark 2 с моего компьютера, подключенного к удаленному кластеру. Если я...

Marco Catalano / 22 мая 2018
0 голосов
0 ответов

Я работаю над сценарием использования, когда мне нужно постоянно собирать и обрабатывать информацию...

scorpio / 20 мая 2018
0 голосов
1 ответ

У меня есть диктория в python {'609232972': 4, '975151075': 4,...

Rvsvgs / 19 мая 2018
0 голосов
1 ответ

Я хочу использовать метод when() в org.apache.spark.sql.Column, когда я иду вперед, получается, что...

Steve YN / 18 мая 2018
0 голосов
1 ответ

Совсем недавно я начал работать с большими данными, и я хочу узнать больше о Spark и Scala, чтобы...

Foxlooo / 16 мая 2018
0 голосов
1 ответ

Я пишу несколько кодов, которые должны работать (как jar) на платформах flink и spark.Однако эти...

Vulcann / 14 мая 2018
0 голосов
2 ответов

Чтобы подвести итог, я пытаюсь запустить тест TPCDS для Spark с оптимизатором катализатора Spark и...

ajaymysore / 10 мая 2018
0 голосов
2 ответов

Можно ли одновременно отправлять и запускать задания Spark в одном кластере AWS EMR? Если да, то не...

Kunal / 09 мая 2018
0 голосов
1 ответ

Я пишу проект Scala, в котором я хочу, чтобы классы, выполняемые из spark-submit, были представлены...

John Sig / 08 мая 2018
0 голосов
0 ответов

Среда разработки и производственная среда часто различаются по емкости (т. Е. Dev кластер сильно...

Vulpo / 07 мая 2018
0 голосов
0 ответов

В моем текущем искровом приложении я указываю контрольные точки на hdfs, а URI hdfs - как показано...

Girish Bhat M / 07 мая 2018
0 голосов
0 ответов

Я пытаюсь обучить алгоритм ALS на Spark-Submit, сохраняя модель на HDFS и ее прогнозы на Cassandra...

Farah / 04 мая 2018
0 голосов
2 ответов

Я занимаюсь разработкой приложения, в котором я читаю файл из hadoop, обрабатываю и сохраняю данные...

Girish Bhat M / 04 мая 2018
0 голосов
0 ответов

У меня есть производственная DynamoDB с около 20 ГБ данных. Мне нужно перенести эти данные в...

Anand Prem / 04 мая 2018
0 голосов
2 ответов

Я хочу выполнить скрипт Scala, используя HDInsight. Ниже в статье описывается запуск скрипта py, но...

Hemant Chandurkar / 03 мая 2018
0 голосов
0 ответов

У меня есть приложение Spark, которое очищает и подготавливает набор данных, а затем применяет...

matthiasdv / 01 мая 2018
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...