Вопросы с тегом Apache-искра - PullRequest

Вопросы с тегом Apache-искра

0 голосов
1 ответ

Моя работа искры не выполняется из-за java.lang.OutOfMemoryError: пространство кучи Java. Я...

pushpavanthar / 04 мая 2018
0 голосов
1 ответ

Я пытаюсь создать дополнительный столбец в кадре данных с автоматически увеличивающимися значениями...

Arjun / 04 мая 2018
0 голосов
1 ответ

1) Мне нужно использовать date_diff() в моем коде, чтобы найти разницу между столбцом Date и...

pissall / 04 мая 2018
0 голосов
1 ответ

У меня есть фрейм данных pyspark, в котором есть столбец данных, а также даты выходных. Я просто...

ggupta / 04 мая 2018
0 голосов
1 ответ

Я пытаюсь найти определенную строку из очень большого файла журнала. Я могу искать строку. Теперь,...

Rudrashis / 04 мая 2018
0 голосов
2 ответов

Я тестирую свой первый Spark Streaming трубопровод, который обрабатывает сообщения от Kafka. Однако...

TH339 / 03 мая 2018
0 голосов
1 ответ

Я хочу, чтобы двое объединились в два набора данных DS1 и DS2, чтобы получить DS3 DS1:...

OOvic / 03 мая 2018
0 голосов
0 ответов

Мы пытаемся интегрировать загрузку Spark и Spring, к сожалению, каждый раз сталкиваемся с...

moun / 03 мая 2018
0 голосов
1 ответ

У меня есть датафрейм со схемой: root |-- col2: integer (nullable = true) |-- col1: integer...

Alan Featherston / 03 мая 2018
0 голосов
3 ответов

Я пытаюсь заменить строку в столбце данных, используя regexp_replace. Я должен применить шаблоны...

marjun / 03 мая 2018
0 голосов
0 ответов

Я новичок в Искре. Я установил PySpark 2.3.0 на Windows. Я работаю над набором данных, который...

Sarsoura / 03 мая 2018
0 голосов
0 ответов

Я читал книгу "Learning Spark" и, например, 5-14, я заметил, что объявлено...

howard / 03 мая 2018
0 голосов
1 ответ

Я использую Solr с Spark в Java для индексирования документов. Я настроил Zookeeper на порт 2181, и...

Dilak / 02 мая 2018
0 голосов
1 ответ

У меня есть одна проблема с искрой, когда я попытался сгенерировать модель, я получил одно...

Hallion / 02 мая 2018
0 голосов
1 ответ

Почему я не могу получить полные данные Hbase в моем терминале host = 'localhost' table =...

LLEERR / 02 мая 2018
0 голосов
0 ответов

Я пробовал random_forest_classifier_example.py , и это работает. Для следующего шага я попробовал...

tnogu / 02 мая 2018
0 голосов
0 ответов

Когда я пытаюсь объединить 3 столбца ArrayType в Spark DataFrame, я получаю ошибочные выходные...

Anubhav Sarangi / 02 мая 2018
0 голосов
1 ответ

У меня проблема при чтении файла изображения из HDFS и использовании класса ImageSchema...

Pham D Khang / 02 мая 2018
0 голосов
0 ответов
0 голосов
2 ответов

Использование Spark 2.2 + Java 1.8 У меня есть два пользовательских типа данных "Foo" и "Bar"....

HansGruber / 02 мая 2018
0 голосов
1 ответ

Я пытаюсь запустить искровой sql-тест для таблицы улья, используя Spark Java API. У меня проблема с...

jymbo / 01 мая 2018
0 голосов
1 ответ

Я пытаюсь прочитать большой файл CSV из S3. Мой размер файла составляет 100 МБ в формате GZip,...

ManojP / 01 мая 2018
0 голосов
0 ответов

Кажется, что у искры есть проблемы с травлением / расслоением на удаленных рабочих. Есть ли способ...

mathtick / 01 мая 2018
0 голосов
1 ответ

Я пытаюсь запустить экспоненциально взвешенное скользящее среднее в PySpark с использованием UDF...

user9722371 / 30 апреля 2018
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...