Вопросы с тегом апач-искра - PullRequest

Вопросы с тегом апач-искра

0 голосов
0 ответов
0 голосов
1 ответ

Мне нужно реализовать ExecuteScript в Nifi, чтобы выполнить транспонирование столбцов, и я...

Micro_Andy / 27 мая 2019
0 голосов
1 ответ

У меня есть скрипт Glue ETL, который берет секционную таблицу Athena и выводит ее в CSV. Таблица...

ronald mcdolittle / 24 мая 2019
0 голосов
0 ответов

Я хочу извлечь данные из списка SharePoint с помощью PySpark. Я не уверен в данных и хранилище...

Aditya / 24 мая 2019
1 голос
2 ответов

У меня есть датафрейм, аналогичный: +---+-----+-----+ |key|thing|value| +---+-----+-----+ | u1|...

Georg Heiler / 23 мая 2019
0 голосов
1 ответ

Я хочу использовать Приближенный поиск ближайших соседей, предоставленный Spark MLlib (ref.) , но я...

diens / 22 мая 2019
0 голосов
1 ответ

Любая идея, как настроить прокси-сервер aws и регион для запуска сеанса или контекста. Я могу...

Ramesh / 22 мая 2019
0 голосов
1 ответ

Я пытаюсь прочитать большое количество больших файлов из S3, что занимает много времени, если...

Somasundaram Sekar / 15 мая 2019
0 голосов
0 ответов

Я работаю над алгоритмом Random Forest с использованием spark-ml. У меня 1000 уникальных категорий,...

Sahil Desai / 07 мая 2019
2 голосов
3 ответов

Я хочу запускать процессы Spark непосредственно в моем кластере, используя IntelliJ IDEA, поэтому я...

Eric Bellet / 02 мая 2019
0 голосов
0 ответов

Я пытаюсь сохранить данные в текстовом файле из кода ниже и сохранить его в корзину S3. После...

Sweta Sharma / 01 мая 2019
0 голосов
1 ответ

У нас есть настройка AWS EMR для обработки заданий, написанных на Scala.Мы можем запускать задания...

Devendra Parhate / 30 апреля 2019
0 голосов
0 ответов

Как я могу перетасовать СДР так, чтобы все разделы результирующего СДР имели одинаковое...

Hichagha / 25 апреля 2019
1 голос
1 ответ

Я обучаю модель LDA в pyspark (версия 2.1.1) на наборе данных отзывов клиентов.Теперь, основываясь...

Usman Khan / 23 апреля 2019
1 голос
0 ответов

Значение yarn.scheduler.maximum-alloc-mb установлено в 143360 МБ в файле yarn-site.xml. Я получил...

vjrock99 / 19 апреля 2019
1 голос
1 ответ
0 голосов
1 ответ

Я относительно новичок в Spark. У меня есть работа Spark, которая работает на кластере Amazon EMR с...

Sorin-Alexandru Cristescu / 17 апреля 2019
0 голосов
0 ответов

Положение Бегущая искра на кластере YARN. Версия Spark 2.4.0 Наличие кастрюли для мойки с меткой...

nullmari / 17 апреля 2019
0 голосов
1 ответ

В последнее время возникают некоторые проблемы с сортировкой в ​​случайном порядке, которые...

Figo / 16 апреля 2019
8 голосов
3 ответов

Я использую приведенный ниже код для записи DataFrame из 43 столбцов и около 2 000 000 строк в...

Dawid / 16 апреля 2019
0 голосов
1 ответ

Какова цель подачи искры?Из того, что я вижу, это просто добавление свойств и фляг в путь к классам

Funzo / 14 апреля 2019
0 голосов
0 ответов

Предположим, у меня есть SQL-запрос, подобный следующему: SELECT team, MAX(score) FROM mytable...

tuzhucheng / 12 апреля 2019
0 голосов
0 ответов

В последнее время я использовал библиотеки intellij-idea, spark & ​​spark-sql для записи данных из...

user1058122 / 10 апреля 2019
0 голосов
1 ответ

Я пытаюсь отправить работу на python в искровой кластер AWS EMR. Мои настройки в разделе параметров...

Zhang YaoWen / 09 апреля 2019
0 голосов
0 ответов

пытаюсь прочитать файл из S3 в spark-shell.Но я получаю сообщение об ошибке ниже. Caused by: java

Indira / 05 апреля 2019
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...