У меня возникла проблема с сохранением Spark ML Pipeline. Я использую Scala 2.11 и Spark 2.3.1. val...
Объединение двух данных приводит к почти 60 столбцам. Большинство из них предполагают, что они...
Вот пример DF: Car Model Colors Toyota RAV4 Red, Black Toyota Camry Red, White (в списке может быть...
У меня есть сценарий, когда мне нужно вызвать до трех служб, чтобы что-то сделать. Каждый сервис...
Можно ли настроить несколько исполнителей для приложения Spark Streaming в локальном режиме,...
DF1 - это то, что у меня сейчас, и я хочу, чтобы DF1 выглядел как DF2. Желаемый вывод: DF1 DF2...
Краткое резюме: Я пытаюсь отобразить несколько гистограмм из Spark DataFrames с Vegas-viz в Scala....
У меня есть файл JSON, который содержит массив JSON test.json [ { "Name": "Bob"...
Я пытаюсь изучить Scala, поэтому я установил openjdk-8-jdk на свою машину с Ubuntu и приступил к...
Допустим, такая ситуация: У меня есть Tuple размера n . Каждый элемент представляет собой флаг...
У меня есть имя таблицы "data", которая имеет 5 столбцов и каждый столбец содержит несколько...
Это мой приведенный ниже фрейм данных, который мне нужно сохранить в формате файла с фиксированной...
Можно ли заменить функцию foldLeft с помощью некоторой комбинации map и filter в Scala? Например на...
Я хочу преобразовать этот базовый SQL-запрос в Spark select Grade, count(*) * 100.0 / sum(count(*))...
Я использовал решения из этого вопроса . Я использовал принятый ответ: МЕТОД def...
У меня есть сценарий, в котором я должен получить разницу между текущей датой и датами в столбце из...
У меня есть Dataframe, у которого есть столбец, который нуждается в некоторой очистке. Я с...
У меня есть следующее рабочее заявление для DS и DF: val ds2 = ds.withColumn("new_telnum"...
У меня есть данные некоторых телефонных записей ниже, я хочу удалить первые два значения из каждой...
Я выполняю искровой код в оболочке scala с использованием jaf-файлов Kafka, и я намерен передавать...
рассмотреть текстовый файл с двумя столбцами a,b c,d a,b a,b d,c b,a e,f g,h с помощью spark-sql и...
У меня есть набор операций, которые выполняются последовательно, но если промежуточная...
У меня есть простой ADT (алгебраический тип данных), закодированный как: sealed trait TrafficLight...
Я создал две конечные точки отдыха в akka http, который принимает строку в качестве входных данных,...
У меня есть последовательность карт. Каждая карта содержит имена столбцов в качестве ключей и...