Вопросы с тегом apache-искра - PullRequest

Вопросы с тегом apache-искра

0 голосов
1 ответ

У меня есть СДР в форме (name,[token1, token2, ...]) с ключом name и значениями token.Например:...

Notna / 20 февраля 2019
0 голосов
1 ответ

возможно ли отображать действительное десятичное значение, а не отображать в научной записи в HBase...

user6835509 / 20 февраля 2019
0 голосов
1 ответ

Добрый день, коллеги, я не могу решить проблему с преобразованием. Пример набора данных:...

Александр Шаповалов / 20 февраля 2019
0 голосов
0 ответов

Я знаю, что Spark намного лучше работает с денормализованными таблицами, где все необходимые данные...

RLM / 20 февраля 2019
0 голосов
1 ответ

У меня ошибка при применении UDF (dot_group) к сгруппированным данным.Эта UDF имеет целью...

Nacho / 20 февраля 2019
0 голосов
2 ответов

Этот ответ хорошо объясняет, как использовать groupby и pandas_udf для pyspark для создания...

Thomas / 19 февраля 2019
0 голосов
1 ответ

У меня есть фрагмент кода в Java 8 для вычисления статистики Annova с использованием Spark SQL API,...

F. Aydemir / 19 февраля 2019
0 голосов
0 ответов

У меня есть большой XML-файл, и я хочу извлечь атрибуты / теги и их значения из XML-файла и...

sachinkshd / 19 февраля 2019
0 голосов
1 ответ

Я работаю над Spark SQL с Spark (2.2) и использую Java API для загрузки данных из файла CSV. В...

Svg_af / 19 февраля 2019
0 голосов
0 ответов

Работа в spark (2.11) над s3 (java, spark standalone) Я получаю org.apache.http

Nizan Grauer / 19 февраля 2019
0 голосов
1 ответ

У меня есть потоковый фрейм данных, который я пытаюсь записать в базу данных.Есть документация для...

Ram / 19 февраля 2019
0 голосов
1 ответ

Я пытаюсь добавить данные Чикаго Преступления, которые находятся в HDFS...

erdemjohn / 19 февраля 2019
0 голосов
2 ответов

У меня есть входной набор данных в следующем формате: +---+--------+----------+ | id| refId|...

Himanshu Yadav / 18 февраля 2019
0 голосов
0 ответов

Использование структурированной потоковой передачи Spark 2.1.1 - это способ изменить уровень...

Rishi / 18 февраля 2019
0 голосов
3 ответов

Я знаю, как это сделать, но я полагаю (или, по крайней мере, надеюсь), что есть более простой и...

RLM / 17 февраля 2019
0 голосов
0 ответов

Я пытаюсь найти связанные компоненты в графе через Pyspark.Во-первых, я определил свой собственный...

Miguel Jiahao Wang / 17 февраля 2019
0 голосов
1 ответ
0 голосов
1 ответ

Я написал ниже запрос в Spark SQL, используя spark-shell, и я получаю сообщение об ошибке ниже...

Ravi / 17 февраля 2019
0 голосов
1 ответ

У меня есть кодовая база python, которая использует pyspark SparkSession.builder для создания...

user481a / 17 февраля 2019
0 голосов
1 ответ

У меня есть CSV для записи с такой схемой: StructType s = schema.add("codeCommuneCR",...

Marc / 17 февраля 2019
0 голосов
0 ответов

Я заметил немного странное поведение в функции PySpark (и, возможно, Spark) to_timestamp.Похоже,...

Asif Iqbal / 16 февраля 2019
0 голосов
1 ответ

У меня есть JavaPairDStream<String, Tuple2<Double, Double>> со значениями, (ADBE,(1.1,1

dominicrd / 16 февраля 2019
0 голосов
1 ответ

Я получаю ниже ошибка при запуске программы.Я пытаюсь найти среднее значение Dstream в формате...

dominicrd / 16 февраля 2019
0 голосов
1 ответ

Я пытаюсь использовать mapPartiton в spark для обработки большого текстового корпуса: допустим, у...

user8734221 / 16 февраля 2019
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...