Вопросы с тегом апаш-искра - PullRequest

Вопросы с тегом апаш-искра

0 голосов
0 ответов

У меня огромный JSON-файл, который я читаю в своей работе Spark Это формат примерно такой:...

DJ180 / 10 апреля 2019
0 голосов
0 ответов

Я использую потоковую обработку искры с приемником foreach для обработки данных iot-пакета. Мне...

goutham r / 10 апреля 2019
0 голосов
1 ответ

У меня есть пример файла, в котором есть строка json, как обработать этот тип файла в spark. Пример...

Vinay Maurya / 10 апреля 2019
0 голосов
2 ответов

Ниже приведены данные о продажах, доступные для расчета max_price.Логика для Max_price Max(last 3...

sp_user123 / 10 апреля 2019
2 голосов
1 ответ

Я записываю фрейм данных Spark в формате Avro в HDFS. И я хотел бы разбить большие файлы Avro,...

Cassie / 10 апреля 2019
1 голос
1 ответ

У меня есть простой код Python, который включает соединение с bigQuery с использованием файла JSON...

Rishabh Gupta / 10 апреля 2019
0 голосов
0 ответов

У меня есть приложение для потокового воспроизведения, которое считывает поток Kafka и вставляет...

nam / 10 апреля 2019
0 голосов
1 ответ

Я хочу сделать несколько запросов к нескольким "строкам" строки json.Под множественной строкой json...

Gatsby / 10 апреля 2019
0 голосов
1 ответ

Ниже приведен мой поток: GetFile > ExecuteSparkInteractive > PutFile Я хочу прочитать файлы с...

Siddhesh Kalgaonkar / 10 апреля 2019
0 голосов
2 ответов

У меня есть два кадра данных со столбцом field массив (строка). Поэтому безопасно ли делать...

Sam / 10 апреля 2019
0 голосов
2 ответов

Я пытаюсь извлечь максимальное значение столбца "ID" в кадре данных искры и увеличить при каждом...

Tejas / 10 апреля 2019
2 голосов
0 ответов

Spark (v2.4) Функция программы: Чтение данных JSON из Kafka очереди в режиме структурированной...

Soumendra / 10 апреля 2019
0 голосов
1 ответ

Я прочитал некоторые документы об управлении памятью Spark. На этой странице: Что будет делать...

Jason Zheng / 10 апреля 2019
0 голосов
1 ответ

Я использую Eclipse Ide для Scala, и я скачал плагин scala-ide с рынка Eclipse.Я получаю сообщение...

Nitin Sherawat / 10 апреля 2019
0 голосов
0 ответов

У меня есть набор данных spark, который был создан с header = "true".Теперь у меня есть только этот...

Random_Coder / 10 апреля 2019
0 голосов
1 ответ

Мне известно, что типичным способом записи строк RDD или Dataframe в HDFS или S3 является...

B. Smith / 10 апреля 2019
0 голосов
0 ответов

Я запускаю обнаружение сообщества на графиках, сделанных из данных CDR телекоммуникаций.Сначала я...

Olivera Novović / 10 апреля 2019
1 голос
1 ответ

Из простого полного примера использования агрегирования окон в Spark 2.31 (HDP 3.0) я вижу, что...

Artem Trunov / 09 апреля 2019
0 голосов
0 ответов

Я сгенерировал файлы паркета, используя режим добавления данных поверх spark.Но при чтении этих...

Sandie / 09 апреля 2019
0 голосов
0 ответов

У меня есть данные потоковой метки времени и я хочу рассчитать некоторые статистические данные за...

Artem Trunov / 09 апреля 2019
1 голос
0 ответов

Как spark определяет, сколько раз реплицировать кэшированный раздел?Уровень хранилища на вкладке...

Jyotiman / 09 апреля 2019
0 голосов
1 ответ

Я пытаюсь ограничить попытки применения искры. Задание повторно отправляется в режиме клиента пряжи...

sumeet agrawal / 09 апреля 2019
0 голосов
0 ответов

Документация Spark Streaming Установка правильного интервала дозирования рекомендует оптимальный...

Polymerase / 09 апреля 2019
1 голос
0 ответов

Мне нравится использовать синтаксис агрегирования карт Spark DataFrame следующим образом: jaccardDf...

Michael West / 09 апреля 2019
0 голосов
0 ответов

Можно ли изменить каталог _temporary, в котором spark сохраняет свои временные файлы перед записью?...

Alessandro / 09 апреля 2019
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...