Вопросы с тегом Apache-искра - PullRequest

Вопросы с тегом Apache-искра

0 голосов
0 ответов

Я могу запустить следующий код и получить включенные выходные данные, но он не работает, если один...

Abraham / 25 августа 2018
0 голосов
0 ответов

У меня есть приложение, которое использует PySpark для извлечения функций, но приложение всегда...

Alex / 25 августа 2018
0 голосов
2 ответов

Я хочу запустить пользовательскую функцию для столбца данных. Столбец содержит длинную строку,...

Moca / 24 августа 2018
0 голосов
2 ответов

Я импортировал данные из базы данных df = spark.read.format("com.mongodb.spark.sql

Matthew / 06 июля 2018
0 голосов
1 ответ

Привет! Я только что настроил режим Spark Cluster Mode и пытаюсь запустить оболочку pyspark, но...

Kenza / 05 июля 2018
0 голосов
0 ответов

С помощью Java я пытаюсь выполнить простой код spark-sql, но получаю Ошибка «Не удается получить...

brucewayne / 05 июля 2018
0 голосов
2 ответов

У меня есть фрейм данных с несколькими столбцами: | a | b | c | d | ----------------- | 0 | 4 | 3 |...

Carl Ambroselli / 05 июля 2018
0 голосов
0 ответов

Я хочу обновлять широковещательную переменную каждую минуту. Поэтому я использую пример кода,...

Tang Xiaoming / 05 июля 2018
0 голосов
0 ответов

Я пытаюсь запустить код STA / LTA, предназначенный для обнаружения событий при потоковой передаче с...

Zeinab Akhavan / 05 июля 2018
0 голосов
2 ответов

У меня есть кадр данных, содержащий только один столбец с элементами типа MapType(StringType(),...

Parag S. Chandakkar / 05 июля 2018
0 голосов
1 ответ

Я создал DataFrame со своими данными для проведения экспериментов по машинному обучению. Я пытаюсь...

LuizF Gonçalves / 04 июля 2018
0 голосов
1 ответ

Я ищу API, который позволил бы мне добавить столбец на основе вывода функций, который имеет доступ...

Brett Ryan / 04 июля 2018
0 голосов
1 ответ

Я хочу разделить имя файла на две строки, подскажите, пожалуйста, как его разделить. Например,...

SUNDAR / 04 июля 2018
0 голосов
1 ответ

Я пытаюсь объединить два кадра данных на группу, чтобы заполнить время для каждого пользователя....

Sotos / 04 июля 2018
0 голосов
1 ответ

Я очень плохо знаком с Hive SQL и пытаюсь применить запрос ко многим столбцам. Вот запрос: select...

Dio / 03 июля 2018
0 голосов
1 ответ

Получение TypeError при отправке с помощью spark-submit --py-files udf TypeError: 'in...

marjun / 03 июля 2018
0 голосов
0 ответов

У меня есть pairRdd, постоянно получающий данные, я хочу выводить его содержимое в тему kafka...

Jonixo / 03 июля 2018
0 голосов
1 ответ

Мне нужно импортировать CSV файл в Spark и преобразовать его в DF, а затем в RDD перед обработкой....

Stefano / 03 июля 2018
0 голосов
0 ответов

Я читал о том, как профилировать мой искровой кластер. Примечание: я использую pyspark. Мне удалось...

claudius / 03 июля 2018
0 голосов
0 ответов

Я изо всех сил пытаюсь понять жизненный цикл переменной в искровых замыканиях и как сериализировать...

Rahul Sharma / 03 июля 2018
0 голосов
1 ответ

Я использую CountVectorizer, чтобы подготовить набор данных для ML. Я хочу отфильтровать редкие...

JB5 / 03 июля 2018
0 голосов
1 ответ

У меня есть фрейм данных PySpark с одним из столбцов (features), который является разреженным...

dportman / 02 июля 2018
0 голосов
0 ответов

Не могли бы вы посоветовать мне, как лучше всего запросить состояние искрового приложения,...

Bohuslav Dvorský / 02 июля 2018
0 голосов
0 ответов

В версии 2.3.0 spark я пытаюсь отправить скрипт python для spark, используя launch() в org.apache

a.e.a / 02 июля 2018
0 голосов
1 ответ

Насколько я уверен, что это условие всегда верно: Допустим, у меня есть 3 таблицы, которые содержат...

monstereo / 02 июля 2018
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...