Вопросы с тегом апаш-искра - PullRequest

Вопросы с тегом апаш-искра

0 голосов
1 ответ

Я создаю приложение Spark и пытаюсь запустить его локально, прежде чем запускать его в EMR или в...

NateH06 / 10 июля 2019
0 голосов
0 ответов

Я использую Pyspark (Python 3.7 с Spark 2.4) и имею небольшую строку кода для сбора даты из одного...

Sidd / 10 июля 2019
1 голос
1 ответ

Мне сложно найти хороший способ отфильтровать набор данных искры. Я описал основную проблему ниже:...

fletchr / 10 июля 2019
0 голосов
0 ответов
0 голосов
1 ответ

Используя pyspark, я извлекаю 1500 полей из файла JSON, сохраняю их как паркет и создаю внешнюю...

Ramya / 09 июля 2019
0 голосов
1 ответ

работают ли задачи на одном и том же этапе одновременно? если да, то к чему относится граница между...

Maher Marwani / 09 июля 2019
0 голосов
1 ответ

Я пытаюсь использовать Apache Spark для загрузки результатов (большого) запроса SQL с несколькими...

codepringle / 09 июля 2019
0 голосов
0 ответов

Я использую spark и scala и пытаюсь читать папки avro с помощью com.databricks - spark-avro_2.11

Ben Haim Shani / 09 июля 2019
0 голосов
1 ответ
0 голосов
0 ответов
0 голосов
1 ответ

У меня есть набор данных, который содержит данные о распродаже за несколько недель.Я хочу...

pexmar / 09 июля 2019
0 голосов
2 ответов

Я пытаюсь создать ETL с платформой с открытым исходным кодом, я слышал о двух вещах, Apache Beam и...

Saranraj K / 09 июля 2019
1 голос
1 ответ

У меня есть огромный файл данных (200 Гб +), который содержит ежедневные метрики (миллионы метрик)....

deeptowncitizen / 09 июля 2019
0 голосов
0 ответов

Используя Spark, я пытаюсь перенести некоторые данные (в формате csv, parquet) в корзину S3. df

Manish Mehra / 09 июля 2019
1 голос
1 ответ

Сценарий: Cassandra размещается на сервере a.b.c.d, а Spark работает на сервере, скажем, w.x.y.z....

Rakshith / 09 июля 2019
0 голосов
0 ответов

Как я могу добиться следующего, передав строку в udf? val df1 = df.withColumn("col_Z",...

femibyte / 09 июля 2019
0 голосов
1 ответ

Я создаю Dataframe из темы kafka с использованием потокового воспроизведения.Я хочу записать...

Rony / 09 июля 2019
2 голосов
2 ответов

Я пытаюсь добавить пустые столбцы в столбец embebed array [struct], таким образом я смогу...

MrElefant / 09 июля 2019
0 голосов
2 ответов

Недавно я встретил что-то странное в SparkНасколько я понимаю, учитывая метод хранения на основе...

Charles Du / 08 июля 2019
0 голосов
0 ответов

Я пытаюсь получить доступ к кластеру Hive без загрузки Hive на моей машине. Я прочитал здесь, что...

Hunter Mitchell / 08 июля 2019
1 голос
1 ответ

Я читаю файл CSV с моего локального компьютера, используя spark и scala, и сохраняю данные в фрейм...

Antony / 08 июля 2019
1 голос
1 ответ
1 голос
1 ответ

Привет! Я пытаюсь запросить таблицу улья из контекста искры. мой код: from pyspark.sql import...

P A / 08 июля 2019
0 голосов
1 ответ

Я пытаюсь получить звание и присоединиться в течение 10 дней, используя либо Scala Spark, либо SQL....

Inna / 08 июля 2019
2 голосов
0 ответов

Я уже давно собираю толстые банки для спарк-представлений, и они работают как шарм. Теперь я бы...

Tom Lous / 08 июля 2019
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...