Я хочу использовать свой собственный токенизатор для токенизации текста, хранящегося как...
ОБНОВЛЕНИЕ: Исправлена ошибка.Была проблема с версиями.Нужно поменять spark-core и другие до...
У меня есть sql, в основном это соединение двух таблиц и получение результата admm_sk , если...
Я новичок в Spark и Scala, и я пытаюсь изучить искру для одного из моих учебных проектов.У меня...
У меня есть несколько потоков в Spark 1.6, записывающих в одну и ту же таблицу кустов (с...
Один из столбцов в моем входном наборе данных имеет значения, подобные приведенным ниже: "Super...
У меня есть набор данных. Столбцы объектов сгруппированы с использованием класса искры org.apache
У меня есть 2 файла, как показано ниже. Файл ключевых слов spark scala hive Файл содержимого this...
Я работаю над отчетом об атрибуции и кэширую фрейм данных, так как он часто используется на более...
У меня есть дистрибутив Cloudera Hadoop, Spark и т. Д., Где версия Spark-Kafka - 0,8 (т.е....
До сих пор у нас есть приложение для пакетной обработки, в котором мы просили источник сообщить нам...
Сохранение DataFrame в таблицу со столбцами VARBINARY вызывает ошибку: com.microsoft.sqlserver.jdbc
Ниже sql запускается на кластере EMR Spark, который запрашивает Redshift.Этот sql отлично работает...
Мне нужно создать несколько файлов JSON на основе комбинаций строк. Например, в приведенной ниже...
я получил 1 сообщение в кафке, состоящее из нескольких независимых строк json.я хочу передать это...
Я новичок в Play Framework. Я пытался добавить библиотеки Spark и Kafka в build.sbt, но получаю эту...
Я установил Hadoop версии 2.8.3 в моей среде Windows 10, и она работает нормально.Теперь, когда я...
встретили некоторую путаницу по поводу фильтра.Существует RDD val имен слов следующим образом:...
Я планирую использовать Apache Zeppelin с Postgresql 9.5.Мой SQL-запрос и данные ниже.Я хочу, чтобы...
В моем Spark DataFrame есть столбец StructType, который я хочу разбить на несколько столбцов. case...
В пакетных заданиях спарк обычно у меня есть источник данных JSON, записанный в файл, и я могу...
Я новичок в Spark и учусь на структурированном потоковом учебнике .Используя spark 2.4 с python. я...
У меня есть следующий код (Java с Spark SQL) - import static org.apache.spark.sql.functions.col; ..
Итак, я соединяю кафку с искрой и хочу найти это значение в моноблоке.Я не знаю, какой подход...
Я пытаюсь построить простую модель линейной регрессии в искре, используя scala.Чтобы проверить...