Вопросы с тегом Scala

0 голосов

1 ответ

Используйте from_json () в Scala для анализа нескольких строк в DataFrame

У меня есть JSON в столбце Spark DataFrame следующим образом: ID| Text| JSON...

S. Rud / 24 мая 2018

0 голосов

1 ответ

Spark Dataframe: вычисление дисперсии между группами

С dplyr R я бы вычислил дисперсию между группами следующим образом: df %>% group_by(group)...

Carl / 24 мая 2018

0 голосов

1 ответ

фильтровать кадр данных из другого значения столбца данных

у нас есть два кадра данных, и нам нужно отфильтровать данные в одном кадре данных с данными в...

kk420 / 24 мая 2018

0 голосов

1 ответ

Изменить тип сложных (массив и структура) столбцов искры

У меня есть Dataframe со следующей схемой: root |-- id: long (nullable = true) |-- ... (other...

soote / 24 мая 2018

0 голосов

1 ответ

CrossValidator, настраивающий искру ML, терпящий неудачу на параметрах "Посторонний Param был найден" при сохранении модели

Я выполняю перекрестную проверку spark ml с помощью regParam для логистической регрессии как части...

KSeeker / 23 мая 2018

0 голосов

3 ответов

Будет ли работать Scala с JDK 1.10

На странице загрузки scala сказано, что у вас должен быть установлен JDK 1.8.О новых версиях JDK...

Dean Schulze / 23 мая 2018

0 голосов

1 ответ

Чтение списка входных текстовых файлов, где отдельные имена файлов содержат запятые

У меня есть папка на HDFS, в которой по какой-то причине содержатся неполные файлы с запятыми в...

Ra41P / 23 мая 2018

0 голосов

1 ответ

spark-shell "error: type mismatch", используя: paste для определения объекта класса / компаньона

Использование spark-shell v1.6. Большие различия при загрузке класса def и объекта-компаньона в...

kmh / 23 мая 2018

0 голосов

1 ответ

sbt не запускается с ошибками сертификата Sun на Mac

Когда я пытаюсь запустить свой sbt, происходит сбой с определенными ошибками, которые мешают...

user461112 / 23 мая 2018

0 голосов

1 ответ

Смещения, зафиксированные не по порядку, с потоковым приемником Hive Spark DataSource API V2

Я использую приемник для сохранения Spark (2.3) Структурированного потокового фрейма данных в...

carl / 23 мая 2018

0 голосов

0 ответов

Скала, кеширование и кофеин

Впервые в Scala, которая, вероятно, является причиной моей проблемы здесь! Я заинтересован в...

hotmeatballsoup / 23 мая 2018

0 голосов

2 ответов

В функциях Spark Window, Почему мы должны использовать drop () в конце

Я новичок в оконных функциях Spark.Я реализую несколько примеров, чтобы узнать больше об этом

M_Gandhi / 23 мая 2018

0 голосов

3 ответов

Найти максимальную подстроку wrt в каждой группе отформатированных строк

Я изо всех сил пытаюсь найти решение для сценария.У меня есть несколько файлов в каталоге.скажем,...

OBoy / 23 мая 2018

0 голосов

1 ответ

Понимание наблюдателя в мониксе

Я читаю Документация Monix о наблюдателях и я столкнулся со следующим примером: Или вы можете...

St.Antario / 23 мая 2018

0 голосов

1 ответ

Spark 2.0 (не 2.1) Dataset [Row] или Dataframe - выберите несколько столбцов для JSON

У меня есть Spark Dataframe с 10 столбцами, и мне нужно сохранить его в Postgres / RDBMS.Таблица...

user9733169 / 23 мая 2018

0 голосов

1 ответ

Создание вложенных данных после объединения в Spark Scala

Моя цель состоит в том, чтобы подготовить в spark / Hadoop информационный фрейм, который я буду...

Nabil / 23 мая 2018

0 голосов

1 ответ

Таблица Hive, созданная с помощью Spark, не видна в HUE / Hive GUI

Я создаю таблицу кустов из scala, используя следующий код: val spark = SparkSession .builder()

Jaime Drq / 23 мая 2018

0 голосов

1 ответ

Искра Исключение: java.lang.NoSuchMethodError: org.apache.http.conn.ssl.SSLConnectionSocketFactory

Когда я запускаю свой код в локальном коде, он работает нормально.Однако, когда я запускаю его в...

Markus / 23 мая 2018

0 голосов

1 ответ

Scala SparkSQL Создать UDF для обработки исключений, когда столбец может быть когда-то структурой, а иногда строкой

Я изо всех сил пытаюсь создать udf для извлечения некоторых данных столбца.Столбец хитрый,...

Benny Elgazar / 23 мая 2018

0 голосов

1 ответ

Spark Structured Streaming: консольный приемник не работает должным образом

У меня есть следующий код для чтения и обработки данных Kafka с использованием структурированной...

KarthikJ / 23 мая 2018

0 голосов

1 ответ

Как SBT разрешает конфликтующие версии библиотек в зависимости

У меня следующая ситуация: + Module A L Library 1.0 + Module B L Module A L Library 2.0 Предположим...

gyoho / 23 мая 2018

0 голосов

1 ответ

Отфильтруйте значение NULL в столбце данных фрейма scala.

У меня есть фрейм данных (df) со следующим: +---------+--------------------+ | col1| col2 |...

Bab / 23 мая 2018

0 голосов

2 ответов

Spark не может прочитать CSV, когда имя последнего столбца содержит пробелы

У меня есть CSV, который выглядит следующим образом:...

Sam Malayek / 23 мая 2018

0 голосов

1 ответ

Как привести столбец String в список

Мой фрейм данных выглядит так: df.schema приводит к: StructType( StructField(a,StringType,true),...

Hugo / 23 мая 2018

0 голосов

1 ответ

Как выполнить многострочный запрос spark sql при хранении в виде строковой переменной?

У меня есть такой код с многострочным запросом val hiveInsertIntoTable = spark.read.text(fileQuery)

gimp770 / 23 мая 2018