Вопросы с тегом Apache-искра - PullRequest

Вопросы с тегом Apache-искра

0 голосов
1 ответ

У меня есть объекты Java Транзакция (Покупатель объекта, Торговец объектом, Int заплачено) в...

BlackCode / 26 июня 2018
0 голосов
1 ответ

Я использовал следующий код: resultRDD = ( data .flatMap(lambda sentence:sentence.split("...

poonam Sampat / 26 июня 2018
0 голосов
0 ответов

Я новичок в apace spark, как мы можем создать контекст искры для веб-приложений. Ниже, я...

Robert / 26 июня 2018
0 голосов
1 ответ

У меня один набор данных в приложении spark имеет следующую форму: some_id class city 1 A ROME 1 A...

Tagera / 25 июня 2018
0 голосов
2 ответов

Я пытаюсь написать функцию flatMap на языке python в понимании списка! simpleRDD = sc

Morti / 23 июня 2018
0 голосов
0 ответов

У меня проблема с большим объектом (400мл соленых), который мне нужно использовать в UDF. Объект...

mvryan / 23 июня 2018
0 голосов
1 ответ

Я делаю простое назначение в Apache Spark, используя Python.Допустим, у меня есть СДР:...

Axel V. / 23 июня 2018
0 голосов
1 ответ

У меня есть датафрейм в PySpark со строковым столбцом со значением...

Steven / 13 июня 2018
0 голосов
1 ответ

У меня есть данные в JavaPairRDD в формате JavaPairdRDD<Tuple2<String, Tuple2<String...

Jack / 13 июня 2018
0 голосов
1 ответ

У меня есть класс реализации для FlatMapFunction >>, String>.Инициализация некоторых...

meeza / 13 июня 2018
0 голосов
1 ответ

Я только начал свою поездку в Pyspark, создав модель логистической регрессии, которая предсказывает...

belmont_richter / 13 июня 2018
0 голосов
1 ответ

У нас есть две доступные версии Spark (1.6 и 2.1).Я установил переменные окружения (например,...

Tim / 12 июня 2018
0 голосов
1 ответ

У меня есть ZipInputStream, содержимое которого находится в формате ".csv".Мне нужно создать RDD

glc / 12 июня 2018
0 голосов
1 ответ

Я использовал df.printSchema() в pyspark, и это дает мне схему с древовидной структурой.Теперь мне...

Ahito / 12 июня 2018
0 голосов
1 ответ

Я использую Spark v2.2.1 через sparklyr v0.6.2 и извлекаю данные из SQL Server через jdbc.Кажется,...

Zafar / 12 июня 2018
0 голосов
1 ответ

У меня есть набор переменных, которые это отметка времени и сеанс.Как бы я сделал индикатор нового...

Micah Pearce / 12 июня 2018
0 голосов
1 ответ

Я пытаюсь получить большинство просматриваемых фильмов из набора рейтинговых данных и сопоставить...

sasi / 11 июня 2018
0 голосов
0 ответов

Есть ли способ прогнозирования с использованием взвешенной скользящей средней в Pyspark?...

pissall / 11 июня 2018
0 голосов
1 ответ

Я пытаюсь установить Spark в экземпляре Docker, а затем подключиться к нему из внешнего процесса...

Abe / 09 июня 2018
0 голосов
1 ответ

Я новичок в Cloudera и пытаюсь перенести рабочие нагрузки с HDP-сервера под управлением Ambari с...

stuart / 09 июня 2018
0 голосов
1 ответ

Я хочу выполнить запрос mysql внутри foreachparition в spark и в конечном итоге получить все...

Hehe / 09 июня 2018
0 голосов
1 ответ

У меня есть фрейм данных PySpark (2.3.0) со столбцом типа отметки времени: >> df.show()...

Nolan Conaway / 08 июня 2018
0 голосов
3 ответов

Я пытаюсь проиндексировать данные вasticsearch о 77M документах с 150 полями.У нас мало...

aouakki / 08 июня 2018
0 голосов
1 ответ

У меня есть функция, которая соединяет список фреймов данных с базовым фреймом данных и возвращает...

Clock Slave / 08 июня 2018
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...