Вот мой набор данных: case class CustomerStats(customerID: Integer, stat: Double) Вот моя текущая...
Я просматриваю их начальную страницу: https://spark.apache.org/docs/latest/quick-start.html И от...
Я использую версию cloudera 5.13.0 и spark 1.6.0.Если я хочу использовать инструмент sbt внутри...
Это, вероятно, глупый вопрос, но я хотел быть уверен, можно ли транслировать функцию в Spark, а не...
У меня есть очень простое приложение Scala, которое я пытаюсь развернуть в Azure Web App (Windows)
Я хочу найти оценку сходства между новостной статьей и твитом.Я хочу увидеть показатель...
Исходные данные - это просто необработанный веб-журнал, агрегированный с использованием Flume и...
У меня есть следующий СДР: Col1 Col2 "abc" "123a" "def"...
У меня есть столбец данных, называемый значением 'description', в следующем формате ABC...
У меня есть кадр данных искры, как показано ниже.Первый столбец содержит содержимое текстового...
Ниже приведены мои примеры данных: 1,Siddhesh,43,32000 1,Siddhesh,12,4300 2,Devil,10,1000 2,Devil...
Когда я определяю Wrapper как класс значений (расширяющий AnyVal): class Wrapper(val string:...
У меня есть таблица dataframeDS. В scala я могу удалить дубликаты по первичным ключам, используя...
Я хочу написать задание (либо в Spark / JAVA), которое должно выполнять шифрование и дешифрование...
(Почти унаследованная) mllib LabeledPoint сохраняется в файле libsvm следующим образом: val...
В пакете Spark есть версия Scala для моделей со смешанным эффектом.В этом пакете нет реализации...
Я попытался реализовать приложение Spark Streaming, которое считывает потоковые данные из Kafka
У меня есть столбец: val originalSqlLikePatternMap = Map("item (%) is blacklisted%" ->...
У меня есть набор данных в формате RDD, где каждая запись - Array[Array[String]].Каждая запись...
Следующий простой код читает JSON string и создает набор данных, когда MyClass является case class,...
Какова логика запроса большего количества исполнителей, чем машин, доступных в вашем кластере? В...
У меня есть 2D-контейнер с примерами данных, как показано ниже: NULL 1 NULL 2 3 NULL NULL 4 5 NULL...
Я хочу переименовать файлы HDFS параллельно, используя spark.Но я получаю исключение сериализации,...
Я пытаюсь зарегистрироваться ниже класса для сериализации Kryo в коде искры, но я получаю сообщение...
Я попытался выполнить приведенный ниже код в оболочке Scala: var chars = ('a' to...