Вопросы с тегом апаша-искра - PullRequest

Вопросы с тегом апаша-искра

0 голосов
1 ответ

Вот моя цель, прочитать таблицу mysql (50 миллионов + строк) в hdfs. версия свечи: 3.0.3 object...

William Chan / 26 августа 2018
0 голосов
0 ответов

Я хотел бы разбить СДР на последовательности элементов, разделенных разделителем. Скажи, у меня...

Soid / 26 августа 2018
0 голосов
0 ответов

Я пытаюсь проанализировать архивированный файл размером 20 ГБ в многострочном формате. Я пытаюсь...

kruparulz14 / 25 августа 2018
0 голосов
1 ответ

Я новичок в Spark, и у меня есть веселая задача, в которой я должен прочитать кучу файлов из S3, в...

g.cyberian / 25 августа 2018
0 голосов
2 ответов

Как я могу проверить, содержит ли мой DF список столбцов? Я попробовал это: finalDF.columns

NoName / 24 августа 2018
0 голосов
1 ответ

Я новичок в Spark и довольно новичок в Clojure (хотя мне действительно нравится то, что Clojure...

Matt / 24 августа 2018
0 голосов
0 ответов

Итак, у меня есть простой UDF object Constants extends Serializable { val COMMA_DELIMITER: String =...

test acc / 24 августа 2018
0 голосов
1 ответ

Часть кода ниже пытается сделать следующее: Для каждого customer_code в sdf1 проверьте,...

Charles Van Damme / 24 августа 2018
0 голосов
0 ответов

Я пытался запустить приведенный ниже код Scala для Spark в Eclipse :: package org.spark.learning...

Sankar / 06 июля 2018
0 голосов
1 ответ

У меня есть два кадра данных: DF1: ID | Col1 | Col2 1 a aa 2 b bb 3 c cc DF2: ID | Col1 | Col2 1 ab...

Carina / 06 июля 2018
0 голосов
1 ответ

У меня есть массив вложенных объектов JSON, подобный этому: [ { "a": 1, "n": {}...

makar / 06 июля 2018
0 голосов
2 ответов

У меня есть фрейм данных df , который имеет 3 столбца (как показано на рисунке). фрейм данных когда...

candyculen / 06 июля 2018
0 голосов
1 ответ

Я создаю тесты для процесса spark / scala для написания блок-тестов (например, Junits). У меня есть...

Srinivas Bandaru / 06 июля 2018
0 голосов
2 ответов

Я пытаюсь сделать плотный вектор из строки. Но сначала мне нужно конвертировать в двойную. Как мне...

mushg / 06 июля 2018
0 голосов
0 ответов

При вычислении статистики для простого распараллеленного сбора в Spark 2.3.0 я получаю некоторые...

Nick / 05 июля 2018
0 голосов
1 ответ

Я понимаю возможности Spark / Hadoop для работы с большими данными, но меня просят использовать их...

The Shoe Shiner / 05 июля 2018
0 голосов
1 ответ

Я пытаюсь отправить приложение Python, используя spark-submit, например: spark-submit \ --conf...

Tw UxTLi51Nus / 05 июля 2018
0 голосов
0 ответов

Я хочу построить проект Spark с Scala, используя Bazel, который был построен с использованием SBT и...

Sandhya / 05 июля 2018
0 голосов
0 ответов

Ребята, я использую приведенный ниже код, чтобы прочитать всю таблицу из cacssandra, используя...

Anish Shetty / 05 июля 2018
0 голосов
1 ответ

Когда я пытаюсь подключиться к внешней базе данных Oracle из AWS Glue, используя JDBC, получаю...

Sreeni / 05 июля 2018
0 голосов
2 ответов

Я пытаюсь получить Pyspark схему из файла JSON, но когда я создаю схему, используя переменную в...

Sumit Gupta / 05 июля 2018
0 голосов
1 ответ

У меня есть запрос на искру, как показано ниже select a.unique_id as unique_id, first(a

N29 / 05 июля 2018
0 голосов
0 ответов

Вариант использования: Datastax DSE Cluster под управлением Cassandra, HiveMetastore (на основе...

tooptoop4 / 05 июля 2018
0 голосов
1 ответ

В настоящее время я пытаюсь подключиться к базе данных Apache Cassandra, используя Apache Spark (2

dillon37 / 05 июля 2018
0 голосов
0 ответов

Я использую автономный Apache Airflow для отправки заданий Spark с помощью SSHExecutorOperator для...

GreGGus / 04 июля 2018
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...