Вопросы с тегом апаш-искровой SQL

0 голосов

2 ответов

Искра избегать строительства RDD каждый раз

У меня есть данные в S3, я могу загрузить данные в S3, поскольку RDD применяет некоторые изменения,...

AbhiK / 30 апреля 2019

2 голосов

1 ответ

Spark 2.2 Join не удается с огромным набором данных

В настоящее время у меня возникают проблемы при попытке объединить (внутренний) огромный набор...

Ali / 30 апреля 2019

0 голосов

0 ответов

java.lang.IllegalStateException: Попытка получить доступ к сборщику мусора SPARK SQL

Я запускаю задание SPARK SQL в Yarn Cluster и сталкиваюсь с проблемой "java.lang

Gowtham SB / 30 апреля 2019

2 голосов

1 ответ

Требование не выполнено: переупорядочение прервано - Spark Cassandra

код - val configDetails2 = configDetails1 .join(skuDetails, configDetails1.col("sku_num")...

sivan / 30 апреля 2019

1 голос

1 ответ

Недопустимая кодировка int при десериализации тем kafka avro в структурированной потоковой передаче

Я пытаюсь обработать потоковые avro-данные из kafka, используя структурированную потоковую...

Vicky / 30 апреля 2019

0 голосов

1 ответ

Печать сообщения отладки Kafka на задании PySpark

Есть ли способ напечатать сообщение отладки Kafka (я думаю о сообщениях журнала, которые похожи на...

Chris Wijaya / 30 апреля 2019

2 голосов

1 ответ

Spark Hbase: как преобразовать фрейм данных в Hbase org.apache.hadoop.hbase.client.Result

У меня есть метод Test, который принимает один аргумент, который является HBase Result org.apache

sravs / 30 апреля 2019

1 голос

1 ответ

Сбой spark.table с java.io.Exception: нет файловой системы для схемы: abfs

У нас есть пользовательский класс файловой системы, который является расширением hadoop.fs

venBigData / 30 апреля 2019

1 голос

2 ответов

Преобразовать фрейм Spark Data в несколько списков с одним столбцом в качестве ключа

Рассмотрим кадр данных Spark df вот так +----+-------+----+----+ |bin|median|min|end|...

Kenny / 29 апреля 2019

0 голосов

1 ответ

Объединить 4 кадра данных в один

У меня есть 4 кадра данных, которые имеют только одну строку и один столбец, и я хотел бы...

DBA108642 / 29 апреля 2019

0 голосов

1 ответ

Получить год из строки datetime в Spark SQL

Я пытался получить год в искровом SQL с помощью функции year () из документации. Строка...

UgoL / 29 апреля 2019

0 голосов

1 ответ

Получение столбца в виде сцепленного столбца из справочной таблицы и первичных идентификаторов из набора данных

Я пытаюсь получить объединенные данные в виде одного столбца, используя следующие наборы данных....

John Humanyun / 29 апреля 2019

0 голосов

1 ответ

Различное поведение rlike в Spark 1.6 и Spark 2.2

Я применяю некоторые фильтры к кадрам данных в Spark 1.6 и Spark 2.2, и у меня совершенно другое...

Selnay / 29 апреля 2019

2 голосов

1 ответ

Как читать Spark SQL UserDefinedType из CSV

Я пытаюсь определить UserDefinedType на основе String, но отличается от StringType в Spark 2.4.1,...

Kal-ko / 29 апреля 2019

0 голосов

0 ответов

Я получаю UnsupportedOperationException при использовании ST_Within в геопарке

Я использовал функцию ST_Within в geoSpark.Но я получаю java.lang.UnsupportedOperationException:...

Nitesh Kataria / 29 апреля 2019

1 голос

2 ответов

Можно ли добавить данные DataFrame в существующий CSV-файл?

На удаленном SFTP сервере у меня есть csv файл с некоторыми данными. Можно ли добавить данные...

Nurzhan Nogerbek / 29 апреля 2019

0 голосов

1 ответ

Не удается разрешить перегруженный метод 'groupByKey'

Я пытаюсь скомпилировать этот код: // Imports import org.apache.spark.sql.{Row, SQLContext,...

Nick Kulese / 28 апреля 2019

0 голосов

0 ответов

Как записать раздел набора данных искры по количеству информации в Java?

У меня есть простой вопрос, как записать разделы набора данных вместе с счетчиками в java. в scala...

Shyam / 28 апреля 2019

0 голосов

1 ответ

Вложенная динамическая схема не работает при разборе JSON с использованием pyspark

Я пытаюсь извлечь определенные параметры из вложенного JSON (имеющего динамическую схему) и...

Harvey / 28 апреля 2019

1 голос

1 ответ

Динамическое распределение искры

У меня есть задание spark, которое выполняется в кластере с включенным динамическим распределением...

Gowtham Kumar Madipuri / 28 апреля 2019

0 голосов

2 ответов

Как заменить пустые значения столбца некоторым значением по умолчанию в Spark sql

В моих данных есть некоторые поля с пустыми значениями, и я хочу заменить эти значения значениями...

Bis / 28 апреля 2019

0 голосов

1 ответ

Spark sql "создать таблицу как выбрать ..." из памяти

Я использую Spark SQL. Spark версия 2.2.2. SQL любит select a.*, b.* from a inner join b on a.id=b

Longxing Wei / 28 апреля 2019

0 голосов

1 ответ

Spark SQL группировать данные по диапазону и запускать оповещения

Я обрабатываю поток данных из Кафки, используя структурированный поток с pyspark. Я хочу...

Nagesh / 28 апреля 2019

0 голосов

0 ответов

Поддерживает ли источник данных Spark версии v2 столбчатые столбцы в приложениях со структурированной потоковой передачей?

Я пытаюсь использовать структурированную потоковую передачу Spark (версия 2.3.1) с использованием...

Venus / 28 апреля 2019

0 голосов

0 ответов

Пример соединения в окнах времени события

Руководство по структурированной потоковой передаче Spark сообщает, что оно поддерживает два типа...

Totem Tang / 27 апреля 2019