У меня есть XSD-файл вместе с XML, схема, о которой я не знаю.Вы могли бы сказать, что XSD является...
Я пытаюсь получить доступ к данным S3 из spark, используя spark 2.2.0, созданный с использованием...
В Spark SQL имеется подсказка о перекосе (см. здесь ).Есть ли аналогичная подсказка для Spark Scala
У меня есть приложение Scala Spark, в котором мне нужно переключаться между потоковой передачей от...
Я пытался запустить модульное тестирование своего кода потоковой передачи с использованием...
Как я могу проверить перекрывающиеся даты из соседних строк (предшествующих и следующих) в...
я работаю над приложением Play Framework: у меня есть несколько маршрутов регистрация пользователя...
У меня есть файл json с этой структурой root |-- labels: struct (nullable = true) | |-- compute
У меня есть RDD объектов, которые я хочу массово удалить из HBase.Прочитав документацию и примеры...
У меня есть метод, который анализирует JSON для объекта.В настоящее время у меня есть два def,...
Я пытаюсь запросить таблицу Hbase с помощью spark, но я получаю эту ошибку: 14: 08: 35.134 [main]...
Я хотел, чтобы объекты Sale из HBase были объединены с их идентификаторами HBase (строковое...
У меня есть следующая leftOuterJoin операция: val totalsAndProds = transByProd
У меня есть это DataFrame val for_df = Seq((5,7,"5k-7k"),(4,8,"4k-8k"),(6,12...
Я работаю над источником данных хранилища данных для apache-spark, основанным на API источника...
Ниже мой RDD val title = movies.map(f=>(f.toString().split("::")(0)
Я анализирую файл журнала для анализа воздействия на клиента с помощью Apache spark.У меня есть...
Я столкнулся со следующей проблемой при работе с udf в spark.Он прекрасно работал, когда я запускал...
Я подсчитываю количество объектов в AWS S3 корзине, используя Scala следующим образом: val...
Я пытаюсь прочитать формат даты ISO 8601 в кадре данных SQL.Но Spark SQL удаляет информацию о...
Предположим, у меня есть таблица, определенная следующим образом в Slick 3.2.3: class ATable(tag:...
У меня есть приложение Scala, которое использует несколько источников данных и объединяет...
Я пытаюсь выяснить, как заставить традиционную инъекцию зависимостей на основе конструктора...
Привет, мне нужна помощь, пожалуйста, как оптимизировать этот код, чтобы все функции использовали...
Я пытаюсь создать код Spark Scala, который может читать любой файл с разным количеством столбцов