Вопросы с тегом апаш-искровой SQL

0 голосов

0 ответов

Как создать несколько задач Spark для запроса разделов Cassandra

У меня есть приложение, которое использует Spark (с Spark Job Server), которое использует хранилище...

VarunG / 07 февраля 2019

0 голосов

1 ответ

вызов SPARK SQL внутри функции карты

В моем коде у меня есть требование, где мне нужно вызывать spark sql для каждой строки dataset....

A Learner / 07 февраля 2019

0 голосов

1 ответ

Является ли dataframe.orderBy (rand) таким же, как dataframe.withColumn ("X", rand) .orderBy ("X")

Я понимаю, что rand() создает столбец со случайными значениями, а orderBy принимает столбец для...

MajesticKhan / 07 февраля 2019

0 голосов

0 ответов

Spark 2 Dataframe с использованием scala

Фрейм данных 1 Person Work_order email P1 111 123@gmail.com P2 222 123@gmail.com P3 111 123@gmail

Ansip / 07 февраля 2019

0 голосов

0 ответов

Используя Java, удалите пустую запись (с нулевым И все типы пробелов) из фрейма данных Spark

Когда я говорю все виды пробелов, я имею в виду пробел или пробел.Таким образом, эта строка может...

Brian Gurka / 07 февраля 2019

0 голосов

1 ответ

PySpark 2.4: TypeError: Столбец не повторяется (с использованием F.col ())

Следующее дает мне исключение TypeError: Column is not iterable: from pyspark.sql import functions...

NYCeyes / 06 февраля 2019

0 голосов

1 ответ

карта не читает каждую запись отсортированного кадра данных в правильном порядке

Привет, сообщество стеков. Я новичок в кодировке Scala и Spark, и я пытаюсь отобразить каждую...

dks / 06 февраля 2019

0 голосов

2 ответов

первая функция агрегата scala, дающая неожиданные результаты

Я использую простой групповой запрос в scala spark, цель которого - получить первое значение в...

muazfaiz / 06 февраля 2019

0 голосов

0 ответов

Java Spark sql Dataset <Row>написать паркет

При записи набора данных в паркет произошла следующая ошибка. data.write()

Sanket M / 06 февраля 2019

0 голосов

2 ответов

Записать фрейм данных pyspark в текст, не меняя его структуру

У меня есть фрейм данных pyspark, как показано ниже +--------------------+ | speed|...

RAM SHANKER G / 06 февраля 2019

0 голосов

2 ответов

Подсчитать разделитель между столбцами в RDD или DataFrame и переместить строки в отдельные RDD или кадры данных.

Я новичок в программировании и запускаю несколько файлов TSV.gz в RDD или Dataframes.Я хочу...

v.rajan / 06 февраля 2019

0 голосов

1 ответ

Существуют проблемы с производительностью в кадре данных Spark

Что рекомендуется и почему в отношении производительности spark.dataframe.count () или spark

Dalganjan Sengar / 06 февраля 2019

0 голосов

1 ответ

Как исправить эту проблему с преобразованием limitbykey в моем коде pyspark?

Я немного застрял, как получить это значение правильно.Ниже приведены мои образцы данных: col_name...

Shankar Panda / 06 февраля 2019

0 голосов

0 ответов

Как исправить исключение: java.math.BigDecimal не является допустимым внешним типом для схемы double при повторном применении схемы в кадре данных?

Я пытаюсь переместить данные из таблицы: system_releases из Greenplum в Hive следующим образом: val...

Metadata / 06 февраля 2019

0 голосов

3 ответов

Тайм-аут PySpark пытается перераспределить / записать в паркет (Тайм-аут фьючерса через [300 секунд])?

Я использую PySpark (на AWS Glue, если это имеет значение).Я получаю ошибки тайм-аута: (кажется, он...

Jiew Meng / 06 февраля 2019

0 голосов

0 ответов

Spark SQL Notebook: автоматическое заполнение имен таблиц и столбцов

Я использую блокнот Azure Data bricks с SQL в качестве основного языка.Он не поддерживает...

Sam / 06 февраля 2019

0 голосов

1 ответ

Как использовать lambda flatMap () в Java с Spark 2.1

Я портирую через приложение Python на Java и застрял на правильном пути реализации лямбда flatMap()

MrBabbels / 06 февраля 2019

0 голосов

1 ответ

Как сгладить столбец в DataFrame

Для данного кадра данных в этом формате: { "field1": "value1",...

covfefe / 05 февраля 2019

0 голосов

0 ответов

Как Spark обрабатывает несколько зависимых XSD и преобразовывает их в один окончательный XML

У меня 2 xml файл 1 содержит данные, а другой содержит схему данных.Я хочу прочитать файл данных и...

user1638818 / 05 февраля 2019

0 голосов

1 ответ

TBLPROPERTIES ('skip.header.line.count' = '1') не работает на sparkThrift, подключенном из билайна с кустом jdbc 1.2.1

Я использую spark 2.3 и подключаю sparkThrift с помощью beeline. Hive jdbc версии 1.2.1 Spark SQL...

Mahesh J / 05 февраля 2019

0 голосов

1 ответ

Как получить значения из столбца dataframe, используя SparkSQL?

Сейчас я работаю со Spark / Scala и пытаюсь объединить несколько фреймов данных, чтобы получить...

Alejandro de la Torre / 05 февраля 2019

0 голосов

1 ответ

Что такое исправление для java.util.NoSuchElementException: None.get, который появляется при запуске приложения spark для перемещения данных в HDFS?

Я пытаюсь переместить данные из GP в Hive с помощью искрового соединителя greenplum jar:...

Photon / 05 февраля 2019

0 голосов

2 ответов

Pyspark - не сохраняющий родительский фрейм данных также удаляет дочерний фрейм данных из кэша

Я делаю что-то вроде этого: import pandas as pd pdf = pd.DataFrame({ 'a': [1, 2, 3],...

Ferrard / 05 февраля 2019

0 голосов

0 ответов

Обнаружение раздела в искре не показывает правильный номер раздела

Обнаружение Spark-раздела не разбивает данные на основе структуры папок У меня есть каталог с...

Atul Bansal / 05 февраля 2019

0 голосов

0 ответов

Разделение данных на равное количество записей для каждой группы в кадре искровых данных

У нас есть данные за 1 месяц, и каждый день имеет данные размером, который находится в диапазоне от...

Krish / 05 февраля 2019