Вопросы с тегом апаш-искра - PullRequest

Вопросы с тегом апаш-искра

0 голосов
1 ответ

Мои входные данные имеют следующую форму: [ { "id": 123, "embedded": {...

Mike / 21 мая 2019
1 голос
2 ответов

Я читаю данные, используя Spark Streaming из источника Kafka, откуда я создаю кадр данных со...

Sparker0i / 21 мая 2019
1 голос
1 ответ

РЕДАКТИРОВАНИЕ. Мне кажется, что он немного ржавый. Следующий фрагмент: import org.apache.spark.sql

thebluephantom / 21 мая 2019
3 голосов
1 ответ

У меня есть rdd с парой ключ-значение в Scala. Я хочу сформировать rdd таким образом, чтобы оно...

datasure / 20 мая 2019
2 голосов
2 ответов

Я использую искру в локальном режиме (master = "local[*]", см. Код ниже).Как я могу...

bourbert / 20 мая 2019
0 голосов
0 ответов

Допустим, у меня есть users таблица user_id | name | etc с некоторыми пользовательскими данными и...

cyniphile / 20 мая 2019
0 голосов
1 ответ

Я запускаю искру на окнах, используя winutils.В оболочке spark при попытке загрузить CSV-файл, но...

aiman / 20 мая 2019
0 голосов
1 ответ

У меня есть столбец в кадре данных, который является массивом [всегда одного элемента], который...

m1nkeh / 20 мая 2019
0 голосов
0 ответов

У меня есть фрейм данных df, где одно из полей - name (строка). Когда я делаю: df

pawelty / 20 мая 2019
0 голосов
1 ответ

У меня есть приложение для потоковой передачи, которое потребляет данные из темы 1 и анализирует их...

user5463155 / 20 мая 2019
1 голос
1 ответ

Я использую спарк-кассандра-разъем для подключения к кассандре от искры. Я могу успешно...

braj / 20 мая 2019
0 голосов
2 ответов

Я пытаюсь прочитать конфигурационный файл в spark read.textfile, который в основном содержит мой...

MJ029 / 20 мая 2019
0 голосов
1 ответ

У меня есть данные CSV. Сначала я хочу преобразовать его в Json, а затем преобразовать в Pair RDD....

user1760952 / 20 мая 2019
0 голосов
1 ответ

Как я могу удалить все данные и удалить все разделы из таблицы Hive, используя Spark 2.3.0 truncate...

Joha / 20 мая 2019
0 голосов
1 ответ

Мне нужно прочитать CSV-файлы в виде потока, а затем преобразовать это в pandas dataframe. Вот что...

Ashkan Rafiee / 20 мая 2019
4 голосов
2 ответов

Я пытался удалить повторяющиеся слова из строки в scala. Я написал udf (код ниже), чтобы удалить...

Vaibhav / 20 мая 2019
0 голосов
1 ответ

Каково поведение по умолчанию для Map Shuffling в более новой версии Spark? Я узнал, что...

Jason_typ / 20 мая 2019
2 голосов
1 ответ

У меня много сомнений, связанных с Spark + Delta. 1) Блок данных предлагает 3 слоя (бронза, серебро...

Eric Gabriel Bellet Locker / 19 мая 2019
0 голосов
1 ответ

Я читаю текстовый файл, и это файл фиксированной ширины, который мне нужно преобразовать в CSV.Моя...

Tarun Khaneja / 19 мая 2019
0 голосов
1 ответ

Я читаю файл JSON в Scala Spark, используя val df = spark.read.json (properties.getProperty...

Coder Me / 19 мая 2019
1 голос
0 ответов

В настоящее время я пытаюсь увеличить ранг RowMatrix в PySpark с каждой итерацией в некотором...

Michael / 19 мая 2019
1 голос
0 ответов

Официальное объяснение состоит в том, что maxIterations будет использоваться для не сходящихся...

Prometheus Ryan / 19 мая 2019
0 голосов
0 ответов

Я хочу интегрировать потоковую передачу искры с kafka и запускать в intellij Моя kafka работает...

akash jayaweera / 19 мая 2019
0 голосов
0 ответов
0 голосов
2 ответов

У меня следующий искровой фрейм: published data 2019-05-15T10:37:22+00:00...

Eugene / 19 мая 2019
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...