Используя spark и scala, я хотел бы установить структуру и использовать одно из значений столбца в...
Как ничего не извлечь из искрового фрейма данных. Мне нужно что-то вроде этого, df.where ("1" ===...
Я создаю искровое задание, и часть кода, о которой идет речь, выглядит следующим образом: var...
У меня есть набор данных, который выглядит следующим образом: https://www1.ncdc.noaa
Я проектирую свой алгебраический тип данных и столкнулся с проблемой отключения неявного класса...
Я использую Spark SQL для извлечения строк из таблицы.Некоторые из этих данных повторяются, и я...
У меня есть объект A, который содержит список объектов B, я хочу получить что-то от каждого объекта...
Для приведенного ниже условия - в котором сопоставление с образцом было определено для...
Как я могу вычислить tf-idf, сгруппированный по столбцу, а не по всему фрейму данных? Предположим,...
У меня есть рабочий процесс для приема и десериализации сообщения kafka avro с использованием схемы...
У меня есть текстовый файл, и у меня есть данные, подобные приведенным ниже:...
У меня есть набор таблиц кустов на основе Avro, и мне нужно прочитать данные из них.Поскольку...
У меня есть датафрейм, как показано ниже private val sample = Seq( (1, "A B C D E"), (1,...
У меня есть фрейм данных со следующей схемой: - scala> final_df.printSchema root |--...
Я пытаюсь использовать Apache StringUtils stripAccents () для удаления акцентов из символов, и...
Вот моя схема root |-- DataPartition: string (nullable = true) |-- TimeStamp: string (nullable =...
Я пытаюсь найти трендовые хэштеги в твиттере, используя потоковую передачу Spark. os -> mac os...
Есть два DF, мне нужно заполнить новый столбец в DF1 скажем Flag при следующих условиях. DF1...
У меня есть стриг, который выглядит следующим образом: "bla bla bla...
В настоящее время я работаю над проектом, который включает в себя Spark API для Scala, MongoDB и...
Есть ли способ преобразовать идентификатор (из внешнего хэша в идентификатор первичного ключа базы...
Я пытаюсь портировать систему Scala на Mockito2.Есть несколько тестовых случаев, которые используют...
У меня проблема с ml.crossvalidator в scala spark при использовании одного горячего энкодера. это...
Я работаю над проектом и имею дело с некоторыми вложенными датами JSON со сложной схемой /...
Взгляните на эти две простые черты: trait TreeNode1[S] { def subNodes: List[S] } trait TreeNode2 {...