Вопросы с тегом апаш-искра - PullRequest

Вопросы с тегом апаш-искра

0 голосов
0 ответов

Я пытаюсь использовать Word2Vec в фрейме данных панд в течение нескольких дней.Решил использовать...

ZeCarioca / 28 сентября 2019
1 голос
0 ответов

Я читал об искомых предикатах spark и сокращении разделов, чтобы понять объем прочитанных данных.У...

Shubham Saxena / 27 сентября 2019
0 голосов
0 ответов

Я хочу обработать поток искр, который исходит от Кафки.Я использую lowerByKeyAndWindow для...

kamalp / 27 сентября 2019
0 голосов
0 ответов

Я новичок в Spark 2.4 с Java 8. Я получил ответ на мой последний подобный запрос.Но если я добавлю...

Tamil / 27 сентября 2019
0 голосов
1 ответ

У меня ниже JSON-файл (подробности) в hadoop.Я могу читать этот файл с hd fs с помощью SQL Context...

kumar k / 27 сентября 2019
0 голосов
1 ответ

У меня есть таблица в Hive, которая имеет схему: root |-- startdate: string (nullable = true) |--...

marknorkin / 27 сентября 2019
0 голосов
0 ответов

Мне нужно хранить и извлекать смещения Кафки из задания Spark Dataframe в пакетном режиме ,...

giorgio amato / 27 сентября 2019
0 голосов
1 ответ

Я часто использую spark-shell и часто это для запуска sql запросов к базе данных.И единственный...

hsenpaws / 27 сентября 2019
0 голосов
0 ответов

Python-скрипт использует Pyspark Library для обработки данных.Он возвращает имя файла JSON вместе...

Nikita Rathi / 27 сентября 2019
0 голосов
0 ответов

Мне нужно визуализировать некоторые карты в Zeppelin через spark и JS (угловой интерпретатор в...

la_femme_it / 27 сентября 2019
1 голос
1 ответ

Я использую Spark 2.3 (HDP 2.3.0.2.6.5.108-1) и Spark Streaming (JavaInputDStream). Я пишу тест...

Juh_ / 27 сентября 2019
0 голосов
1 ответ

Мы используем AWS EMR для запуска искровых заданий.Из ганглиев мы видим, что использование памяти...

Akshay Chopra / 27 сентября 2019
0 голосов
1 ответ

Когда фрейм данных разделяется и снова объединяется с различными столбцами, сколько и как создаются...

jtk / 27 сентября 2019
0 голосов
0 ответов

У меня есть фрейм данных, показанный ниже в «Текущем фрейме данных» после потоковой передачи из...

Anil Kumar K B / 27 сентября 2019
0 голосов
2 ответов

У меня есть такая таблица: Clients City Timestamp 1 NY 0 1 WDC 10 1 NY 11 2 NY 20 2 WDC 15 В...

salamanka44 / 27 сентября 2019
1 голос
2 ответов

Когда я пытаюсь понять разницу между coalesce () и repartition (), я понял, что coalesce может...

Niketa / 27 сентября 2019
2 голосов
1 ответ
0 голосов
0 ответов

До сих пор мне удавалось найти примеры, где вы можете сканировать / запрашивать HBase либо по...

cranberry / 27 сентября 2019
0 голосов
0 ответов

Простой вопрос, я всегда читал об использовании Kafka с потоковой передачей искры...

giorgio amato / 27 сентября 2019
0 голосов
0 ответов

Я пытаюсь прочитать тему Кафки в моем пакетном задании Spark и опубликовать в другой теме.Я не...

ak0817 / 26 сентября 2019
1 голос
2 ответов

Я выставлю свою проблему на основе исходного кадра данных и того, которого я хочу достичь: val...

Javier de la Iglesia / 26 сентября 2019
0 голосов
2 ответов

Я хочу написать Spark Dataframe в формате Parquet.snappy в HDFS.В настоящее время он создает по...

sumeet agrawal / 26 сентября 2019
0 голосов
0 ответов

Требуется получить StructType (имя поля и DataType) иерархии схемы (вложенная схема) и поместить...

Tamil / 26 сентября 2019
0 голосов
0 ответов

В Java у меня есть набор данных Spark (Spark Structured Streaming) со столбцом типа java.util

vinsce / 26 сентября 2019
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...