Вопросы с тегом апаша-искра - PullRequest

Вопросы с тегом апаша-искра

0 голосов
1 ответ

Как использовать метод Spark hadoopFile, чтобы использовать пользовательский формат ввода с типом...

samthebest / 14 мая 2019
2 голосов
1 ответ

Мы используем apache spark для запроса данных из apache kylin через jdbc, мы пишем sql с...

hometown / 14 мая 2019
1 голос
1 ответ

Как создать несколько фреймов данных, используя один и тот же класс case?Предположим, я хочу...

Rittik De / 14 мая 2019
0 голосов
1 ответ

У меня большой набор данных для преобразования одной структуры в другую. Во время этой фазы я также...

jk1 / 14 мая 2019
0 голосов
0 ответов

Я работаю над фреймом данных, в котором один столбец однозначно идентифицирует данные, а другой - в...

Catarina Nogueira / 14 мая 2019
0 голосов
2 ответов

Каждый день я получаю файл с ~ 2k столбцами.Есть 900 столбцов "отношения".Например: data.id | name...

Adas Kavaliauskas / 13 мая 2019
0 голосов
1 ответ
0 голосов
0 ответов

Таким образом, у меня есть искорка, которая работает каждый час. Работа обрабатывает файлы из HDFS....

Vamshi Lonavath / 13 мая 2019
3 голосов
1 ответ

Моя текущая проблема следующая ... Exception in thread "main" org.apache.spark.sql

Lenny D. / 13 мая 2019
0 голосов
0 ответов

У меня есть определенный сценарий создания извлечения файла dat/delimited в scala/spark; просто...

knowone / 13 мая 2019
0 голосов
1 ответ

У меня есть таблица в dataframe с тремя столбцами.city_name, driver_name, транспортные средства, из...

rahul chaturvedi / 12 мая 2019
0 голосов
0 ответов

Играю со Spark уже около 5 месяцев, так что наверняка еще новичок. У меня есть работа, на которую я...

DataDog / 12 мая 2019
0 голосов
1 ответ

Везде в Google ключевое различие между Spark и Hadoop MapReduce указано в подходе к обработке:...

emilly / 12 мая 2019
1 голос
1 ответ

Вот что я пытаюсь сделать: Я читаю данные в scala Извлекаю несколько столбцов Используя JEP,...

Rookie111 / 12 мая 2019
2 голосов
1 ответ

Я использую Spark 2.3 (Pyspark) для чтения данных из индекса Elasticsearch 6.6. Задание Spark...

user9074332 / 11 мая 2019
0 голосов
0 ответов

Я пытаюсь продемонстрировать выполнение сценария Pyspark Mllib в распределенном кластере Spark. Он...

Mindtree / 11 мая 2019
0 голосов
1 ответ

У меня есть датафрейм, полученный после чтения таблицы, как показано ниже, с использованием spark:...

Metadata / 11 мая 2019
0 голосов
1 ответ

У меня есть mutable.MutableList [emp] со следующей структурой. case class emp(name: String...

Babu / 11 мая 2019
0 голосов
1 ответ

Я установил спарк с sbt в зависимости проекта.Затем я хочу изменить переменные искрового окружения,...

Golddy / 11 мая 2019
0 голосов
0 ответов

У меня есть фрейм данных, в котором я разделил его на «matchedDF» и «unmatchedDF» на основе...

user2704580 / 11 мая 2019
0 голосов
0 ответов

Исключение Stackstrace: java.sql.SQLException: Нет подходящего драйвера Maven: ojdbc7 12.1.0.1...

user3855050 / 10 мая 2019
0 голосов
2 ответов

Я пытаюсь преобразовать процесс импутации прямой заливки, основанный на предыдущем сообщении о...

thePurplePython / 10 мая 2019
0 голосов
0 ответов

Я конвертирую ниже функции pyspark в Spark-Scala. В функции pyspark мы передаем в качестве...

suchitdreams / 10 мая 2019
0 голосов
0 ответов

Как уже упоминалось в названии, я пытаюсь запустить действие оболочки, которое запускает искровую...

DPEZ / 10 мая 2019
1 голос
0 ответов

Я пытаюсь настроить автономный спарк-кластер на моей машине с Windows и запустить приложение scala...

Tusharjain93 / 10 мая 2019
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...