Вопросы с тегом Apache-искра - PullRequest

Вопросы с тегом Apache-искра

0 голосов
1 ответ

Нужно добавить некоторые условия в spark sql lag функцию в моих данных есть идентификаторы и даты,...

Charlet / 04 января 2019
0 голосов
3 ответов

Я создал набор данных в Spark, используя Java, прочитав файл CSV.Ниже приведен мой начальный набор...

Nandu / 04 января 2019
0 голосов
0 ответов

Исключение при чтении файла CSV в спарк. Я хочу прочитать файл TSV из hdfs, используя sqlcontext

Vamsi Nimmala / 03 января 2019
0 голосов
0 ответов

Я пытаюсь вызвать распараллеливание со списком размером приблизительно 100, когда размер всего...

tamirg / 03 января 2019
0 голосов
5 ответов

Я пытаюсь сгруппировать и суммировать для кадра данных PySpark (2.4), но не могу получить значения...

LaSul / 03 января 2019
0 голосов
3 ответов

У меня есть приведенный ниже фрейм данных, и я пытаюсь получить значение 3097 в виде целого числа,...

LaSul / 03 января 2019
0 голосов
1 ответ

Хотелось бы узнать, поддерживает ли Amazon EMR 5.20 AMI Java 9? Не могу найти здесь информацию.Мне...

Michel Hua / 02 января 2019
0 голосов
1 ответ

в Spark, в чем разница между union и or-clause? Давайте рассмотрим пример: Вот мой фрейм данных: df...

Steven / 02 января 2019
0 голосов
1 ответ

Я использую PySpark и добавил пару банок к $SPARK_HOME/jars, но получаю ошибку py4j.protocol

Clock Slave / 02 января 2019
0 голосов
0 ответов

Я пытаюсь использовать библиотеки XGBoost для Scala, которые могут работать на спарке. Для этого я...

Clock Slave / 02 января 2019
0 голосов
2 ответов

У меня есть несколько имен столбцов в смешанных случаях в моем Dataframe, как sum(TXN_VOL) Я хочу...

A Learner / 02 января 2019
0 голосов
1 ответ

Это было давно, но я вернулся еще раз .. Проблема: Когда я пытаюсь преобразовать любой столбец типа...

n1c9 / 31 декабря 2018
0 голосов
1 ответ

Я пытаюсь решить данные, как показано ниже, но я не понял, используя groupy и udf, а также...

Harry / 30 декабря 2018
0 голосов
2 ответов

у меня есть эта схема данных: df: root |-- id: long (nullable = true) |-- a: array (nullable =...

reeena11 / 30 декабря 2018
0 голосов
1 ответ

Я пытаюсь сделать мессенджер чата Facebook с помощью dialogflow v2.Я настроил URL-адрес webhook в...

Madhesh / 29 декабря 2018
0 голосов
1 ответ

Как преобразовать объект класса Python с полями, в которых создаются другие классы, в DataFrame?Я...

Yuriy / 28 декабря 2018
0 голосов
1 ответ

Я пытаюсь создать схему следующим образом: root |-- _ehid: string (nullable = true) |-- duration:...

Сергей Ярымов / 28 декабря 2018
0 голосов
0 ответов

Я написал map функцию, которая не выполняется. Ниже приведен мой код, синтаксически правильный, но...

A Learner / 28 декабря 2018
0 голосов
1 ответ

Я скачал пакет spark-2.4.0-bin-without-hadoop.tgz и установил в свою систему.Я хотел бы запустить...

ajaysaini / 28 декабря 2018
0 голосов
1 ответ

Мне удалось распечатать вывод.Но я хочу записать их в Spark DataFrame и затем вставить их в таблицу

PSG / 28 декабря 2018
0 голосов
2 ответов

Может кто-нибудь сообщить мне, как фильтровать метку даты в файле У меня есть следующие файлы в...

Carltonp / 27 декабря 2018
0 голосов
0 ответов

У меня есть два фрейма данных PySpark, которые я пытаюсь объединить в новый фрейм данных.Кажется,...

lejin / 27 декабря 2018
0 голосов
0 ответов

Я пытаюсь начать работу с transform и action функцией в PySpark впервые, но серьезно столкнулся с...

BANDI HEMANTH / 27 декабря 2018
0 голосов
2 ответов

У меня есть DF1, df1 = sc.parallelize([(1, "book1", 1), (2, "book2", 2), (3,...

Vicky / 27 декабря 2018
0 голосов
1 ответ

Извинения, если это вопрос новичка, я новичок в PySpark и Python. У меня есть этот RDD, который...

Malik / 27 декабря 2018
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...