Я хочу запустить несколько параллельных SQL в одном кластере, чтобы я мог использовать весь...
У меня есть набор данных в формате scala> rxClaimsUpdated.take(1) res0: Array[(String,...
У меня есть следующая схема: root |-- Id: long (nullable = true) |-- element: struct (containsNull...
Я хочу сделать полное сканирование на hbase из Spark 2 , используя Scala . У меня нет...
У меня есть отсортированный набор данных, который обновляется (фильтруется) внутри цикла в...
Я пытаюсь прочитать данные из Hive и запись в пользовательский объект в Salesforce, используя диск...
Я пытаюсь создать карту Scala из 2 классов Java: TopicPartition (java.lang.String topic, int...
Я работаю над анализом логов (в формате Json) в Scala. Я не знаю, как поступить. Я могу получить...
У меня есть файл данных с тремя столбцами, и я хочу нормализовать последний столбец, чтобы...
Я начал базовый проект scala / spark / cassandra, и я новичок в scala и spark. В настоящее время я...
У меня есть следующий код: val dataFrames: List[DataFrame] = [...] // TODO There has to be a better...
Я получил некоторые результаты запроса от Neo4j в виде массива [AnyRef]. Каждый элемент массива...
Я отдельно проверил свой код ошибки в оболочке scala scala> val p6 = sc.parallelize(List(...
Я хочу прочитать входящие данные по теме Google PubSub, обработать данные и преобразовать их в...
Я создал jar в spark 2.2.1, который был создан в target/scala-2.11.Jar. Он работал нормально, но я...
Я использую Streaming для получения записей о звонках от брокера Kakfa каждые 10 минут. Я хочу...
содержимое моего файла 0001,02,003 004,0005,06 0007,8,9 Я читаю файл как val file1 = spark.read
У меня есть PDF-файл в деванагири. Некоторые из глифов отображаются неправильно. Я хочу извлечь все...
Как перебрать объект JSON without knowing key/value pairs и их типы в Scala
Я использую spark stream (scala) и получаю записи звонков клиентов в колл-центр через kafka через...
Я пытаюсь подключиться к Hive через Intelliji. Я использую Scala версии 2.11.4, версии spark-core,...
Это расширение этого вопроса, Группа Apache Spark путем объединения типов и подтипов . val sales =...
У меня есть этот набор данных в искре, val sales = Seq( ("Warsaw", 2016,...
Я использую честный планировщик вместе с пряжей spark.scheduler.pool - это локальное свойство,...
Почему в этом коде есть неоднозначная ссылка на перегруженное определение? class A { def m(a1: A,...