Вопросы с тегом апаш-искровой-SQL - PullRequest

Вопросы с тегом апаш-искровой-SQL

3 голосов
1 ответ

У меня есть каталог партера, содержащий 5 файлов, как показано ниже: Я использую версию Spark 2.2 и...

Aman / 29 октября 2019
1 голос
1 ответ

Я пишу сценарий для AWS Glue, созданный в S3-файлах, хранимых в S3, в котором я создаю DynamicFrame...

Javier / 29 октября 2019
0 голосов
3 ответов

Я использую Spark для обработки моих данных. Моя работа в Spark - это операция Только для карты , и...

Vaibhav / 29 октября 2019
1 голос
1 ответ

Я ищу способ разделить все мои фреймы данных в моем приложении по размеру доступного ядра. Если мои...

Naresh Krishnamoorthy / 28 октября 2019
2 голосов
3 ответов

В настоящее время у меня есть такой фрейм данных +------------+----------+ | A | B |...

sparkFish / 28 октября 2019
1 голос
0 ответов

Я использую spark-sql.2.4.1v, datastax-java-cassandra-connector_2.11-2.4.1.jar и java8. У меня есть...

Shyam / 28 октября 2019
0 голосов
0 ответов

У меня есть набор данных с примерно 500 тыс. Строк и 20 столбцов. Данные разбиты на уровни, всего...

JBoy / 28 октября 2019
0 голосов
1 ответ

Я пытаюсь суммировать поле, содержащее массив, a = sc.parallelize([("a", [1,1,1]),...

RobinL / 28 октября 2019
1 голос
1 ответ

У меня есть требование, чтобы столбцы со значениями были транспонированы в строки. Например,...

marie20 / 28 октября 2019
1 голос
1 ответ
0 голосов
0 ответов
0 голосов
1 ответ

Я пытаюсь перебрать много файлов во многих папках в файле данных. Я две идеи, как показано ниже. //...

asher / 27 октября 2019
1 голос
0 ответов

Когда я пытаюсь записать фрейм данных в виде паркета, размеры файлов неодинаковы. Хотя я не хочу...

sunny_39 / 27 октября 2019
1 голос
1 ответ
3 голосов
0 ответов

У меня есть одно преобразование, единственная цель которого - удалить дубликаты. При использовании...

Jesse / 26 октября 2019
0 голосов
0 ответов

regexp_replace не работает в spark sql Я пытаюсь использовать regexp_replace в spark sql, ожидаемая...

amit kumar singh / 26 октября 2019
1 голос
1 ответ

Я устанавливаю параметры пакетного процесса Spark для использования из Kafka, но когда я пытаюсь...

tenderfoot / 26 октября 2019
1 голос
2 ответов

Я использую Spark 2.4.0 и хотел бы узнать, как решить следующую проблему с помощью Spark: Каждая...

Eric / 26 октября 2019
0 голосов
2 ответов

У меня возникли проблемы с поиском первой строки в исходном коде Spark после запуска «spark.sql...

Bostonian / 26 октября 2019
0 голосов
0 ответов

Я создал фрейм данных массивов, используя spark.sql и .toDF(). Мой код ошибки говорит...

Erin Hwang / 26 октября 2019
4 голосов
1 ответ

Я использую Spark в режиме local из среды IDE / eclipse. Я вижу, что Spark UI создает множество...

SanBan / 25 октября 2019
1 голос
0 ответов

Я нашел много ответов в StackOverflow, как найти лучшие записи N. ​​ Например: df

grep / 25 октября 2019
1 голос
2 ответов

Эксперты, я заметил одну странную вещь с одним из заданий Pyspark в рабочем режиме (работающим в...

Sidd / 25 октября 2019
0 голосов
0 ответов

У меня есть пакетное задание Spark, которое читает некоторые файлы json, записывает их в Hive, а...

marknorkin / 25 октября 2019
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...