Вопросы с тегом apache-искра - PullRequest

Вопросы с тегом apache-искра

2 голосов
0 ответов

У меня есть настройка широковещательной переменной в отдельном файле py, и затем я импортирую ее в...

ranjith / 23 апреля 2019
0 голосов
1 ответ

Я хочу выполнить левое внешнее объединение в наборе данных с использованием искрового Java API.Как...

vvp / 23 апреля 2019
0 голосов
1 ответ

хотел бы знать, позволяет ли всем работникам успешно завершить свои работы, где отправляется...

Sanjiv Kumar / 23 апреля 2019
0 голосов
0 ответов

Я не могу заставить pyspark работать с pyenv. Запуск pyspark во время активации virtualenv не...

cammil / 22 апреля 2019
0 голосов
1 ответ

Я пытаюсь записать искровой фрейм данных в облачное хранилище Google. Этот фрейм данных имеет...

karthik reddy / 22 апреля 2019
0 голосов
1 ответ

У меня есть транслируемый словарь Python, который содержит фильтры даты по пользователю....

DataTx / 22 апреля 2019
0 голосов
1 ответ

Я пытаюсь запустить код Python, который ссылается на Apache Spark на Mac OSX 10.14.4, но у меня,...

Pedro L / 22 апреля 2019
1 голос
1 ответ

Я пытаюсь отфильтровать большой RDD на основе широковещательной переменной. Я смог сделать...

DataTx / 22 апреля 2019
0 голосов
1 ответ

Я пытаюсь преобразовать запрос SQL в программу spark. В SQL-запросе я обнаружил тег (distribution =...

Aakash Agrawal / 22 апреля 2019
0 голосов
1 ответ

Я пытаюсь использовать Java-API spark-sql для подключения cassandra. Ниже банку я использую...

Shyam / 22 апреля 2019
0 голосов
0 ответов

Я новичок в использовании Spark для приложений с большими данными.Почему-то кажется, что pyspark не...

joshua clark / 22 апреля 2019
1 голос
0 ответов

Может ли кто-нибудь помочь мне с тем, как реализовать умножение матрицы на вектор в методе...

sjrk / 21 апреля 2019
1 голос
1 ответ

У меня есть этот кусок кода: File jsonFile = Paths.get(jsonPath).toFile(); BufferedReader...

Hanh.TD / 20 апреля 2019
0 голосов
1 ответ

Я пишу программу для загрузки данных по какой-либо ссылке s3a: //. Программа компилируется через...

dee cue / 19 апреля 2019
1 голос
0 ответов

Итак, я загружаю фрейм данных, ~ 5 миллионов строк, ~ 80 столбцов. Один из столбцов, назовем его X,...

Ferrard / 18 апреля 2019
1 голос
1 ответ

У меня есть jar-пакет, созданный из приложения с загрузочной пружиной, где внутри я создаю сеанс...

rakeeee / 18 апреля 2019
1 голос
2 ответов

Я хочу фильтр df1 по time_create==last_timestamp, фильтр df2 по выбранным store_product_id из df1...

Mithril / 18 апреля 2019
0 голосов
1 ответ

Я пытаюсь запустить простое задание Java Spark, используя Oozie в кластере EMR.Задание просто берет...

AntonyP / 18 апреля 2019
0 голосов
1 ответ

Скажем, у меня есть набор данных с 1 000 000 идентификаторов.Как бы я пошел на разделение по...

j doe / 17 апреля 2019
0 голосов
1 ответ

Я пытаюсь провести рефакторинг проекта, используемого в spark-cassandra, от scala_2.11 до java_1.8

Shyam / 17 апреля 2019
0 голосов
1 ответ

Я пытаюсь взорвать один столбец во многих строках в задании Java Spark.Когда я делаю разнесение...

user1948874 / 17 апреля 2019
0 голосов
0 ответов

В настоящее время я использую драйвер Phoenix для HBASE, используя искру от Kafka Я пишу в соленый...

smalltalkguy / 17 апреля 2019
0 голосов
1 ответ

Я запускаю Spark RDD через collect (). Каждая отдельная задача занимает много времени для обработки...

DanJ / 17 апреля 2019
0 голосов
0 ответов

Мой ввод - это файл csv / tsv или любой другой, разделенный разделителем, и его заголовок.Я хочу...

Jeremy.Q / 17 апреля 2019
0 голосов
3 ответов

Я ищу способ найти в python spark строку с двумя отдельными словами.например: IPhone x или Samsun...

ben othman zied / 17 апреля 2019
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...