Вопросы с тегом апаша-искра - PullRequest

Вопросы с тегом апаша-искра

0 голосов
1 ответ

У меня есть набор данных со столбцом stringType, который содержит нули. Я хотел изменить каждую...

Ignacio Alorre / 10 сентября 2018
0 голосов
1 ответ

У меня есть RDD, в котором у меня есть слово и его векторное представление. Я последовал следующему...

Ajay / 10 сентября 2018
0 голосов
1 ответ

Я получаю zip-архив «2018-06-26.zip» каждый день размером примерно ок. Сжатый 250 МБ, содержащий...

Dan Kjeldstrøm Hansen / 10 сентября 2018
0 голосов
2 ответов

Я пытаюсь проиндексировать DataFrame приведенной ниже схемы в ElasticSearch, используя разъем...

mongolol / 10 сентября 2018
0 голосов
2 ответов

У меня есть корзина s3 с почти 100 тысячами сжатых файлов JSON. Эти файлы называются [timestamp]

Hans / 10 сентября 2018
0 голосов
1 ответ

Я хочу создать файл CSV. При выполнении следующего кода Spark R выдает ошибку. sc <-...

Shree / 10 сентября 2018
0 голосов
2 ответов

Я новичок в Spark DataFrame. У меня есть текстовый файл с такими данными, как schoolid,classid...

pooja / 09 сентября 2018
0 голосов
1 ответ

Я использую Airflow для планирования отправки JAR-файлов (соответствующих упаковке приложений...

scalacode / 09 сентября 2018
0 голосов
1 ответ

Если у меня есть RDD[(Int, Array[Boolean])], как я могу объединить значения из каждого набора?...

Tmpoul / 09 сентября 2018
0 голосов
1 ответ

У меня есть фрейм данных, который выглядит следующим образом:...

Global Warrior / 08 сентября 2018
0 голосов
1 ответ

Есть ли способ объединить два последовательных ключа в массив в rdd? Допустим, RDD это: (0,0) (0,0)...

pipisIsBack / 08 сентября 2018
0 голосов
2 ответов

Я читаю файл USA_Housing.csv, столбцы которого (Средний доход по районам, средний по возрасту дом,...

Mohamed Lotfy Elrefai / 08 сентября 2018
0 голосов
1 ответ

Я новичок в Apache spark и недавно установил его, но получил ошибку: **Error: Could not find or...

user35282 / 08 сентября 2018
0 голосов
1 ответ

При использовании Kryo обычно рекомендуется регистрировать классы, которые вы собираетесь...

Matt / 07 сентября 2018
0 голосов
0 ответов

Я пытаюсь выполнить какую-то фильтрацию файла последовательности и сохранить его в другом файле...

Marcin Gasior / 07 сентября 2018
0 голосов
0 ответов

У меня есть таблица улья с 3 столбцами: id, event_time, payload значение полезной нагрузки - это...

mishkin / 07 сентября 2018
0 голосов
1 ответ

Это ссылка на решение, данное в scala для потока [ Как избежать дублирования столбцов после...

Bharat Sharma / 07 сентября 2018
0 голосов
1 ответ

Мне нужно передать большое количество csv файлов в качестве источника, каждый из которых содержит...

Upkar Kohli / 07 сентября 2018
0 голосов
1 ответ

У меня большой фрейм данных pyspark. Я хочу получить его корреляционную матрицу. Я знаю, как...

Chemmyyu / 07 сентября 2018
0 голосов
0 ответов

Постановка задачи При этом приведены пример и ожидаемый результат. Дерево описывается тремя...

Chris / 07 сентября 2018
0 голосов
1 ответ

Я пытаюсь обновить или добавить новые поля в конфигурацию куста в кластере dataproc, используя поле...

Deepak Verma / 06 сентября 2018
0 голосов
2 ответов

Я пытаюсь сделать что-то очень простое, и у меня очень глупая борьба. Я думаю, что это должно быть...

seth127 / 06 сентября 2018
0 голосов
0 ответов

Мы используем apache spark в автономном режиме для mllib. У нас также есть DFS (распределенная...

Santhosh Tpixler / 06 сентября 2018
0 голосов
1 ответ

Мой файл содержит несколько строк, которые имеют разную структуру. Каждый столбец распознается по...

error / 06 сентября 2018
0 голосов
0 ответов

Сначала я запускаю spark-shell в Windows, и я читаю файл с локального val res0 = sc

Mr.H / 06 сентября 2018
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...