Вопросы с тегом апаша-искра - PullRequest

Вопросы с тегом апаша-искра

0 голосов
2 ответов

Можно ли запросить файл TSV напрямую, используя Spark SQL?Чтобы было ясно, я говорю о Spark SQL, а...

Benjamin Du / 02 июля 2019
0 голосов
0 ответов

Я пытаюсь создать конвейер данных с использованием spark и scala в Maven Project. Данные поступают...

Aryan / 02 июля 2019
0 голосов
2 ответов

У меня есть набор данных (~ 100 ГБ) в S3, который имеет метку времени, за которой следует строка...

Eumcoz / 02 июля 2019
1 голос
1 ответ

Я использую Spark для записи данных в Alluxio с UFS в качестве S3 с использованием секционированной...

Nupur Bharati / 02 июля 2019
3 голосов
1 ответ

Мне нужно импортировать файл CSV, который содержит несколько полей, позже я должен выполнить цикл...

dkh / 02 июля 2019
0 голосов
2 ответов

У меня есть датафрейм с начальным статусом с именем init.У меня есть датафрейм с той же схемой, где...

Michail N / 02 июля 2019
1 голос
2 ответов

Для каждой строки в приведенном ниже кадре данных я хочу найти имена столбцов (в виде массива,...

iJup / 02 июля 2019
1 голос
1 ответ

Я выполняю искровые работы в режиме пряжи. Я использую spark-submit для запуска заданий внутри...

user10437665 / 02 июля 2019
0 голосов
0 ответов

Этот код агрегирует между новым CSV-файлом и существующими данными MongoDB.Как существующие, так и...

ing / 02 июля 2019
0 голосов
0 ответов

Я объявил объект Sparksession в классе scala. Выдает ошибку "не найдено: значение SparkSession" ...

Prasad / 02 июля 2019
1 голос
1 ответ

У меня есть список наборов данных, которые я хочу разделить по определенному ключу, который...

Mayank / 02 июля 2019
1 голос
2 ответов

Я читаю XML-файл в Scala <tag1> <tag2 id="0" attr1="abc" ... /> .....

maks / 01 июля 2019
0 голосов
1 ответ

Мне нужно получить схему из CSV-файла (имя столбца и тип данных). Я достиг этого уровня - l =...

pratik rudra / 01 июля 2019
0 голосов
0 ответов

получая эту ошибку, у кого-нибудь есть идея, что ее вызывает? #### sc is a spark connection...

Mouad_S / 01 июля 2019
0 голосов
0 ответов

Как обсуждалось в нескольких других вопросах ( здесь и здесь ), команда hadoop fs -du -s -h (или...

DNA / 01 июля 2019
1 голос
0 ответов

Столбцы feature_1_(double) и feature_2_(double) в приведенном ниже кадре данных (df2) создаются с...

iJup / 01 июля 2019
0 голосов
1 ответ

Я хочу создать класс case динамически, и для этого я написал программу, но не смог определить класс...

Yogendra Kumar / 01 июля 2019
1 голос
1 ответ

Мне нужна помощь, чтобы понять итерацию в 'scala'.У меня есть фрейм данных, который имеет другой...

Praveen / 01 июля 2019
0 голосов
0 ответов

Я пытаюсь загрузить и написать таблицу больших запросов, используя spark, однако я не могу ни...

AlphaCR / 01 июля 2019
0 голосов
0 ответов

Я использую Spark (более EMR 5.24.0) в качестве механизма распределенной обработки для большой...

Modi / 01 июля 2019
0 голосов
0 ответов

Я получаю ошибку ниже при разборе файла XML, который имеет 20 уровней вложенности в кластере...

Ankit Mathur / 01 июля 2019
0 голосов
0 ответов
0 голосов
1 ответ

Я предварительно обрабатываю свои данные (2000K + строки) и хочу подсчитать дублированные столбцы в...

DADA206 / 01 июля 2019
1 голос
1 ответ

Я получаю сообщение об ошибке ниже, когда пытаюсь составить список больших двоичных объектов,...

Gomzi / 30 июня 2019
1 голос
1 ответ

У меня есть датафрейм, df2, такой как: ID | data -------- 1 | New 3 | New 5 | New и основной кадр...

Ahmed El Gohary / 29 июня 2019
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...