Вопросы с тегом апаш-искра - PullRequest

Вопросы с тегом апаш-искра

0 голосов
1 ответ

Впервые в Scala. Я создал функцию подстроки в scala, которая требует "pos" и "len", я хочу, чтобы...

AmsKumar / 29 мая 2019
1 голос
1 ответ

Я пытаюсь запустить кластер AWS emr и отправить шаг, используя EmrCreateJobFlowOperator и...

A.B / 29 мая 2019
2 голосов
0 ответов

У меня есть список интервалов, которые я хотел бы объединить при наложении. пример: List((1,1),(2...

Learner / 29 мая 2019
1 голос
2 ответов

У меня есть требование копировать данные из одной исходной таблицы Hive в другую целевую таблицу....

Akjpunia / 29 мая 2019
0 голосов
0 ответов

Я пытаюсь записать данные файла CSV в Avro, ниже я прилагаю свой код. public class CsvToAvro {...

svk 041994 / 29 мая 2019
0 голосов
1 ответ

Я хочу использовать образ Docker с Apache Spark в Ubuntu 18.04. Более популярное изображение из...

Bor / 29 мая 2019
1 голос
2 ответов

У меня есть CSV-файл, как показано ниже В нем 6 строк с верхней строкой в ​​качестве заголовка, в...

Sahil / 29 мая 2019
0 голосов
0 ответов

Я запускаю небольшое приложение Spark, используя spark-submit. Это терпит неудачу с исключением. Но...

RahulK / 29 мая 2019
1 голос
1 ответ

У меня есть следующий фрейм данных val count :Dataframe = spark.sql("select 1,$database_name...

Rahul Rawat / 29 мая 2019
0 голосов
1 ответ

Привет! Я хочу сохранить свой искровой фрейм данных в файл с пользовательским форматом, таким...

Shreyas Kaushik / 29 мая 2019
0 голосов
0 ответов

Наше искровое задание - это очень простое потоковое приложение Kafka, которое потребляет пакет...

Wizard / 29 мая 2019
2 голосов
1 ответ

Я пытаюсь получить размер папки для некоторых папок S3 с scala из командной строки EMR. У меня есть...

Dick McManus / 29 мая 2019
0 голосов
0 ответов

Я использую AWS Glue для сканирования XML-файлов и добавления их в таблицу базы данных Glue....

jscott / 28 мая 2019
0 голосов
1 ответ

У меня есть данные в CSV, как показано ниже, первая строка пуста, а вторая строка заполнена только...

Kumar P / 28 мая 2019
0 голосов
2 ответов

У меня есть конечная точка API, написанная sparksql со следующим примером кода. Каждый раз, когда...

Chandler.Huang / 28 мая 2019
0 голосов
1 ответ

У меня есть поток Kinesis, в который мое приложение записывает ~ 10K сообщений в секунду в формате...

danieln / 28 мая 2019
0 голосов
1 ответ

У меня есть данные транзакции, но мне нужно рассчитать количество посещений на основе countDistinct...

Manas Jani / 28 мая 2019
0 голосов
1 ответ

Я использую Sparklyr для проекта и понял, что сохранение очень полезно.Я использую sdf_persist для...

Vincent / 28 мая 2019
0 голосов
0 ответов

Я установил Spark и столкнулся с проблемами при загрузке модуля pyspark в ipython.Я получаю...

Jassim Elakrouch / 28 мая 2019
0 голосов
1 ответ

Версия Spark: Scala 2.12.8 (Java HotSpot(TM) 64-Bit Server VM, Java 1.8.0_211) В следующем коде...

user10149299 / 28 мая 2019
1 голос
1 ответ

У меня есть СДР следующим образом: [(((1, 2), 1.0), (2, 3)), (((1, 2), 1.0), (3, 4)), (((1, 2), 3

kriti arora / 28 мая 2019
1 голос
1 ответ

Я пытаюсь получить доступ к каждой строке определенного "числа" столбца Int, чтобы проследить...

Naresh_17 / 28 мая 2019
0 голосов
1 ответ

Я просматривал показатели работы AWS Glue и обнаружил что-то странное ... Зачем нужно количество...

Jiew Meng / 28 мая 2019
0 голосов
0 ответов

Простое val postsAndUsers = posts.join(users, $"_OwnerUserId" === users("_Id"),...

Aravind R. Yarram / 28 мая 2019
0 голосов
0 ответов

При попытке записать фрейм данных в Bigquery с помощью драйвера Simba. Я получаю исключение ниже....

Phoenix / 27 мая 2019
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...