Вопросы с тегом апаш-искра - PullRequest

Вопросы с тегом апаш-искра

0 голосов
0 ответов

У меня есть один DataFrame (d1) с (index, features) и второй (d2) с теми же столбцами. features...

Wonay / 12 мая 2018
0 голосов
1 ответ

Я запускаю Spark в автономном режиме с каталогом Hive.Я пытаюсь загрузить данные из внешнего...

kirylm / 12 мая 2018
0 голосов
0 ответов

Я использую pyspark (Spark 2.1.1), чтобы вывести схему файла csv: sc.read.csv('/some/file

user3124181 / 11 мая 2018
0 голосов
1 ответ

У меня есть DataFrame, подобный этому: id val1 val2 ------------ 1 v11 v12 2 v21 v22 3 v31 v32 4...

user3685285 / 11 мая 2018
0 голосов
0 ответов

У меня есть таблица кустов, созданная поверх s3 DATA в формате паркета и разделенная на один...

user2221654 / 11 мая 2018
0 голосов
1 ответ

Spark 2.x здесь. Мне нужно настроить следующие конфигурации Hadoop, чтобы мой SqlContext мог...

hotmeatballsoup / 11 мая 2018
0 голосов
1 ответ

У меня есть SparkSQL DataFrame, подобный этому: name gender age isActive points...

user3685285 / 11 мая 2018
0 голосов
2 ответов

У меня есть задание Spark Structured Streaming, которое настроено на чтение данных из Kafka....

Niranjan / 11 мая 2018
0 голосов
1 ответ

Я пытаюсь развернуть фрейм данных необработанных данных размером 6 ГБ, и это занимало 30 минут...

Geeta Singh / 11 мая 2018
0 голосов
1 ответ

Мне нужно saveAsSequenceFile мой объект класса Java (по какой-то причине я не могу исправить сам...

Marat Saitkulov / 11 мая 2018
0 голосов
0 ответов

Я работаю в PySpark, используя Spark 2.1, чтобы подготовить свои данные для построения...

Amber Z. / 11 мая 2018
0 голосов
1 ответ

у нас возникают редкие проблемы с записью в S3 внутри заданий Spark в Amazon EMR (5.13). Вот часть...

Eduard Vlasov / 11 мая 2018
0 голосов
1 ответ

Существует два подхода к управлению журналированием. Один - через log4j.properties, а другой -...

Abhishek Soni / 11 мая 2018
0 голосов
1 ответ

У меня есть раздел RDD в кластере, и я хочу сделать reduceByKey для каждого раздела отдельно.Я не...

Hoori M. / 11 мая 2018
0 голосов
1 ответ

Я хочу разделить данные, используя ID, и с каждым разделом я хочу - применить набор операций...

Nandita Dwivedi / 11 мая 2018
0 голосов
2 ответов

Я новичок в scala и несколько часов бьюсь над итерацией этого массива WrappedArray в массиве и...

Daniel / 11 мая 2018
0 голосов
2 ответов

Это цитата из jaceklaskowski.gitbooks.io . Некоторые операции, например, map, flatMap, filter, не...

Hoori M. / 11 мая 2018
0 голосов
0 ответов

Ниже тестируемый сценарий, Работа: Задание Spark SQK написано на Scala и выполняется на 1 ТБ ДАННЫХ...

kaushik H S / 11 мая 2018
0 голосов
0 ответов

Используйте sparkSession. Когда я читаю файл паркета, я получаю следующую ошибку: мой код: val df =...

Shaokai Li / 11 мая 2018
0 голосов
0 ответов

Я создал искровой кластер с тремя узлами, один для главного, а два других - для рабочих.Я вижу двух...

Gang / 11 мая 2018
0 голосов
1 ответ

У меня есть два следующих кадра данных df1 +--------+----------------------------- |id | amount |...

Nick01 / 11 мая 2018
0 голосов
1 ответ

Я пытаюсь скопировать данные из одного местоположения BLOB-объекта Azure в другое местоположение...

Ramana / 11 мая 2018
0 голосов
2 ответов

Я пытаюсь обработать строку / объект со многими столбцами как часть скользящего окна, используя...

Mark Sivill / 11 мая 2018
0 голосов
1 ответ

Я пишу приложение Java Spark, которое должно подключиться к кусту и получить некоторую базовую...

pkscoder / 10 мая 2018
0 голосов
1 ответ

Scala 2.11 здесь. У меня есть следующая таблица БД: [input] === id BIGINT UNSIGNED NOT NULL, name...

hotmeatballsoup / 10 мая 2018
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...