Вопросы с тегом apache-искра - PullRequest

Вопросы с тегом apache-искра

0 голосов
0 ответов

Я пытаюсь запустить следующий код: lst = [25, 90, 81, 37, 776, 3320] testData = sc.parallelize(lst)...

Katheria / 03 февраля 2019
0 голосов
0 ответов

Мне нужно обновить широковещательную переменную с течением времени (скажем, через определенный...

Ajax1986 / 02 февраля 2019
0 голосов
0 ответов

Я хочу реализовать собственный искровой классификатор с пользовательскими параметрами в java

Decrayer / 01 февраля 2019
0 голосов
2 ответов

Я работаю с PySpark над огромным набором данных, где я хочу отфильтровать фрейм данных на основе...

Sotos / 01 февраля 2019
0 голосов
0 ответов

from pyspark import SparkContext, SparkConf import initspark ` conf = SparkConf()

Nicolas Joos / 01 февраля 2019
0 голосов
1 ответ

Мне нужно создать Spark Dataset<Row> из таблицы Salesforce. У меня есть фрагмент кода,...

aiman / 01 февраля 2019
0 голосов
2 ответов

У меня есть тема Kafka и приложение Spark.Приложение Spark получает данные из раздела Kafka,...

alina / 31 января 2019
0 голосов
1 ответ

Предположим, у вас есть фрейм данных со столбцами различных типов (string, double ...) и...

Ferrard / 31 января 2019
0 голосов
1 ответ

Я недавно начал обнаруживать блоки данных и столкнулся с ситуацией, когда мне нужно отбросить...

samba / 31 января 2019
0 голосов
1 ответ

Pyspark использует cProfile и работает в соответствии с документацией для RDD API, но, похоже, нет...

Jason / 31 января 2019
0 голосов
1 ответ

Я получаю ошибку импорта, когда отправляю рабочий процесс с Hue, который содержит Spark-Action....

Carlos Segovia / 30 января 2019
0 голосов
1 ответ

Я создаю и программно использую свою среду PySpark с нуля через conda и pip pyspark (как я...

NYCeyes / 30 января 2019
0 голосов
0 ответов

Я новичок в pyspark и сталкиваюсь с несколькими проблемами при выполнении заданий. Я отправляю...

Tabish Tehseen / 30 января 2019
0 голосов
0 ответов

Это большой текстовый файл данных обзоров Amazon, который мне нужно очистить и обобщить в RDD с...

Ankur Patel / 30 января 2019
0 голосов
0 ответов

Я хочу использовать pyspark с emr-динамодб-коннектором , чтобы прочитать всю таблицу динамодаба в...

vaer-k / 30 января 2019
0 голосов
4 ответов

У меня есть CSV с данными ниже: dept|emp_json|location finance|{...

tkkman / 30 января 2019
0 голосов
0 ответов

Как создать фрейм данных с двумя столбцами, а именно p_vals и t_vals, содержащие значения,...

nardaj / 29 января 2019
0 голосов
1 ответ

У меня около 70 запросов к ульям, которые я последовательно выполняю в pyspark.Я ищу способы...

Ananth Gopinath / 29 января 2019
0 голосов
1 ответ

У меня есть следующая задача: загрузка данных из одной таблицы из нескольких схем использование...

Juraj / 29 января 2019
0 голосов
1 ответ

У меня есть набор данных CSV со следующими столбцами (Accident_Id, Date, Area) и сотнями строк.Чего...

Oxford / 28 января 2019
0 голосов
1 ответ

Я пытаюсь изменить все столбцы искрового фрейма данных на двойной тип, но я хочу знать, есть ли...

GDK / 28 января 2019
0 голосов
1 ответ

Я хочу использовать предварительно встроенную модель встраивания (fasttext) в приложении pyspark....

bib / 28 января 2019
0 голосов
0 ответов

Итак, вот мой искровой код на python, который я выполняю с запущенным в фоновом режиме hadoop: from...

Pedro González / 27 января 2019
0 голосов
2 ответов

Мое приложение Kafka считывает потоковые данные в реальном времени, обрабатывает их и сохраняет в...

user1326784 / 27 января 2019
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...