Вопросы с тегом apache-искра - PullRequest

Вопросы с тегом apache-искра

0 голосов
0 ответов

Я использую Apache Beam KafkaIO в качестве источника моего конвейера. Мне нужно прочитать две темы...

marknorkin / 14 марта 2019
0 голосов
0 ответов

Я работаю над заданием моего мастера, чтобы создать предиктор рейтинга фильма с помощью ALS от...

Mariano Peñas / 13 марта 2019
0 голосов
0 ответов

Я использую RandomForestClassifier модель MLLIB в pyspark, и я хочу извлечь прогноз как вероятность...

SiSi / 13 марта 2019
0 голосов
0 ответов

Какой ноутбук лучше подходит для анализа данных Zeppelin или Jupyter?что насчет их лицензии?Какие...

CodeVY / 13 марта 2019
0 голосов
0 ответов

Я написал модель ml, используя Spark MLLib в pyspark.Я хочу сохранить файл моей модели в моей...

Yashwanth Madaka / 13 марта 2019
0 голосов
0 ответов

В python spark я хочу знать, возможно ли настроить моего собственного потребителя kafka с потоковой...

anonuser1234 / 13 марта 2019
0 голосов
1 ответ

Я хочу иметь возможность запустить команду, например spark-submit test_file.py --dependencies=...

Regressor / 12 марта 2019
1 голос
2 ответов

Как мне распечатать весь фрейм данных в Java без нехватки памяти? Dataset<Row> df = ... Я...

CoffeeIsProgramming / 12 марта 2019
0 голосов
1 ответ

Я пытаюсь написать UDF для pyspark, который будет сравнивать два Sparse Vector для меня.Я хотел бы...

Tom / 12 марта 2019
0 голосов
4 ответов

У меня есть набор данных, как показано ниже, +------+------+---------------+ | col1 | col2 |...

Garry Steve / 12 марта 2019
0 голосов
0 ответов

Я пробовал PySpark RandomForestClassifier при определении важности объектов, и я был озадачен,...

nicholas_law_91hotmailcom / 12 марта 2019
0 голосов
1 ответ

Итак, я пытаюсь обработать данные в Spark, поступающие из потока kafka, а затем отправить их в...

mourya / 11 марта 2019
0 голосов
2 ответов

У меня есть файлы A и B, которые в точности совпадают.Я пытаюсь выполнить внутреннее и внешнее...

Aviral Srivastava / 11 марта 2019
0 голосов
2 ответов

В столбце состоят из значений C1 C2 1 1235 1 4578 1 4177 2 1427 2 1427 2 1427 2...

sIVAKUMAR / 11 марта 2019
0 голосов
2 ответов

Рассмотрим этот набор данных рейтинга фильмов (userId, movieId, rating, timestamp) 1,1,4.0...

Kenny / 11 марта 2019
0 голосов
1 ответ

Я хочу отсортировать имеющееся у меня СДР, которое содержит диапазон ключей 0-49995, такой что (0,...

MitterHai / 10 марта 2019
1 голос
1 ответ

У меня есть приложение spark, которое столкнулось с ошибкой OutOfMemory. Журнал GC выглядит...

sgu / 09 марта 2019
0 голосов
1 ответ

Я пробовал код как в ( this_post ) и не могу получить разницу в дате в секундах. Я просто беру...

a_geo / 09 марта 2019
2 голосов
1 ответ

В приложении Java с Spark 1.6.2 я хочу протестировать на CI env (travis или gitlabCI) некоторые...

Thomas Decaux / 08 марта 2019
0 голосов
0 ответов

При отправке задания Python в режиме кластера возникает следующая ошибка: appcache /...

Elisabetta / 08 марта 2019
0 голосов
0 ответов

Я новичок в PySpark и попытался настроить среду локально. Я установил Spark, Hadoop, PySpark, Livy...

user19881219 / 08 марта 2019
0 голосов
1 ответ

Я читаю транзакции из темы Кафки в формате json. затем я применил некоторые преобразования, чтобы...

Swetha / 08 марта 2019
1 голос
3 ответов

У меня есть столбец с типом Timestamp в формате yyyy-MM-dd HH:mm:ss в кадре данных. Столбец...

Yorel Live / 07 марта 2019
3 голосов
1 ответ

Контекст: Мне нужно отфильтровать фрейм данных на основе того, что содержит столбец другого фрейма,...

LePuppy / 07 марта 2019
1 голос
1 ответ

В Java Spark работает следующий код: ZipFile zipFile = new ZipFile(zipFilePath); Enumeration<?...

Ya Ko / 07 марта 2019
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...