Вопросы с тегом apache-искра - PullRequest

Вопросы с тегом apache-искра

0 голосов
0 ответов

У меня есть 2 сервера, на которых установлен и настроен MapR.Я использую Py-Spark для...

Temp Expt / 15 февраля 2019
0 голосов
0 ответов

У меня есть задание MR, которое создает файл последовательности с ключом в качестве экземпляра...

MozenRath / 15 февраля 2019
0 голосов
1 ответ

Я пытаюсь прочитать данные из таблицы улья, хранящиеся в формате Parquet.Я использую распределение...

Partha / 15 февраля 2019
0 голосов
0 ответов

Я боролся с тем, как сделать запрос pyspark, который извлекает данные из созданной мною таблицы...

CadenJoe / 15 февраля 2019
0 голосов
0 ответов

Я пытаюсь выполнить spark-submit ***.py , затем я получил Ошибка: не удалось найти или загрузить...

Yu-Ting LIN / 14 февраля 2019
0 голосов
0 ответов

Я пытаюсь прочитать текстовый файл и разделить его на предложения с помощью спарка.Для этого мне...

user415612 / 14 февраля 2019
0 голосов
1 ответ

Я пытаюсь читать авро-сообщения от Кафки, используя PySpark 2.4.0. Внешний модуль spark-avro может...

Panagiotis Fytas / 14 февраля 2019
0 голосов
0 ответов

У меня есть это требование для сравнения метки времени текущей строки с предыдущей строкой кадра...

Himanshu Yadav / 14 февраля 2019
0 голосов
2 ответов

Я бы хотел отправить SparkApplication в кластер Kubernetes программно из python. Определение...

hansonhill / 14 февраля 2019
0 голосов
1 ответ

Все еще новичок в Spark, и я пытаюсь сделать это окончательное преобразование максимально чистым и...

DataDog / 14 февраля 2019
0 голосов
1 ответ

Я использую Apache spark в пакетном режиме.Я настроил весь конвейер, который преобразует текст в...

Cobra / 14 февраля 2019
0 голосов
1 ответ

Я читаю данные из различных источников JDBC, используя метод чтения PySpark.JDBC читает из Teradata...

Hein du Plessis / 13 февраля 2019
0 голосов
1 ответ

spark1.6, извлечение данных из моей базы данных Vertica для работы с ним, приведенный ниже запрос...

Mahmoud Odeh / 13 февраля 2019
0 голосов
1 ответ

Я использую Java-Spark, я получаю сообщение из темы Кафки, которое указывает путь к zip-файлу, я...

Ya Ko / 13 февраля 2019
0 голосов
0 ответов

Исходя из различных критериев, я должен сравнить временную метку текущей строки с предыдущей...

Himanshu Yadav / 13 февраля 2019
0 голосов
1 ответ

Я бы хотел перебрать содержимое столбца в искре DataFrame и исправить данные в ячейке, если она...

JBoy / 13 февраля 2019
0 голосов
1 ответ

Как я могу изменить файл csv на DataFrame. значения csv - country,2015,2016,2017,2018,2019 Norway,4

vengatesh aravinth / 13 февраля 2019
0 голосов
1 ответ

Я пытаюсь выполнить ниже SQL-запрос в SPARK, используя Java: Dataset<Row> perIDDf =...

A Learner / 13 февраля 2019
0 голосов
1 ответ

Я пытаюсь выполнить юнит-тест моего метода, который подключается к Cassandra и выполняет оператор...

raizsh / 13 февраля 2019
0 голосов
1 ответ

Я пытаюсь получить все уникальные значения СДР и соответствующие им числа вхождений.Я пытался...

Rahul / 13 февраля 2019
0 голосов
1 ответ

Я хочу удалить числа с 5 или более цифрами из столбца DataFrame, используя RegexTokenizer PySpark

huppert / 13 февраля 2019
0 голосов
1 ответ

Моя конечная цель - использовать PySpark для эффективной индексации большого объема данных в...

LaserJesus / 13 февраля 2019
0 голосов
0 ответов

Я пытаюсь создать новые кадры данных, используя столбцы исходного кадра данных (df0). Я пытался...

Aziz Azizos / 13 февраля 2019
0 голосов
2 ответов

У меня есть инструмент, который использует org.apache.parquet.hadoop.ParquetWriter для...

James Wierzba / 12 февраля 2019
0 голосов
0 ответов

У меня проблема с pyspark.Я могу запустить свой кластер, когда я загружаю pysparkshell из командной...

plankton / 12 февраля 2019
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...