Этот вопрос касается groupByKey () в spark с использованием scala. Рассмотрим ниже данные Name...
У меня есть фрейм данных, который выглядит следующим образом:...
У меня есть сервер Nodejs, на котором не установлена spark, и у меня есть spark с настройкой YARN...
Есть ли способ объединить два последовательных ключа в массив в rdd? Допустим, RDD это: (0,0) (0,0)...
У меня просто вопрос в отношении синтаксиса именованных параметров Scala. Я создал приведенный ниже...
Когда я создаю функцию UDF, как показано выше, я получаю ошибку сериализации задачи. Эта ошибка...
Привет, я получаю эту ошибку компиляции - Unspecified Value parameters: aggregator: (String, String...
Я читаю файл USA_Housing.csv, столбцы которого (Средний доход по районам, средний по возрасту дом,...
как я могу преобразовать RDD[(Int,Int)] в RDD[Array[(Int,Int)]], где я комбинирую элементы с их...
У меня есть CSV-файл, в котором содержится около 10 тыс. Запросов для моего сеанса. Я использую...
Есть похожий вопрос здесь , но это решение не работает в sbt v1.x В сборке sbt хорошо...
Я пытаюсь запустить несколько тестов. А именно assertDataFrameEquals(etalon, agg) на 2 данных. Но...
Я пытаюсь выполнить какую-то фильтрацию файла последовательности и сохранить его в другом файле...
У меня есть таблица улья с 3 столбцами: id, event_time, payload значение полезной нагрузки - это...
Я пытаюсь запустить FPGrowth, но на самом деле я наткнулся на проблему с типами ввода. Учитывая...
У меня есть аннотация макроса, которую я использую для добавления класса неявного типа в...
Я новичок в Zeppelin, возможно, мой вопрос наивен. Сначала я получаю базовые данные, такие как:...
все! У меня небольшая проблема с сопоставлением с шаблоном Scala. Я использую Korolev framework для...
Я использую Соединитель DataStax Spark для заполнения кластера Cassandra и обработки данных в...
при построении через Intellij Idea я получил следующее сообщение: Ошибка: scalac: «jvm-1.10»...
У меня есть следующий DataFrame df: +-------------------+--------+--------------------+ | id| name|...
В моем фрейме данных scala есть столбец с типом данных array (element: String). Я хочу отобразить...
У меня есть кейс класса case class A(tm: java.time.Instant) При попытке получить StructType этого...
У меня есть файл с записями, как показано ниже...
У меня есть таблица в формате df, в которой также есть представление, созданное с помощью table