Вопросы с тегом Apache-искра - PullRequest

Вопросы с тегом Apache-искра

3 голосов
1 ответ

Я пытаюсь прочитать файл CSV, чтобы я мог запросить его с помощью Spark SQL.CSV выглядит следующим...

A Beginner / 04 июня 2019
0 голосов
0 ответов

Я использую pyspark для чтения текстовых файлов, которые кодируются gbk. Так как же я могу...

cxco / 04 июня 2019
0 голосов
2 ответов

Я пытаюсь загрузить драйвер MySQL JDBC из приложения python.Я не вызываю программу «bin / pyspark»...

Maryam / 04 июня 2019
0 голосов
1 ответ

Я пытаюсь создать пользовательские аннотации времени загрузки с AspectJ, Open JDK11 без Spring...

Deepakkumar Arumugam / 03 июня 2019
0 голосов
2 ответов

У меня есть следующие данные, которые я хочу отфильтровать, применяя счетчики к столбцу cd (т. Е....

praxnet / 03 июня 2019
0 голосов
0 ответов

В приложении, которое я разрабатываю, мне нужно проанализировать с помощью Spark различные...

jinzo78 / 03 июня 2019
0 голосов
0 ответов

У меня есть задание Spark, которое прекрасно работает при локальном запуске, но мгновенно...

YWNA655 / 03 июня 2019
1 голос
1 ответ

Попытка создать фрейм данных Spark с данными SparseVector ... любая идея как? from pyspark.sql...

thePurplePython / 02 июня 2019
1 голос
0 ответов

everibody!Я работаю со Spark с использованием Java 8. Я использую набор данных для хранения данных

Fernando de Sá / 01 июня 2019
0 голосов
1 ответ

Я запускаю кластер на EMR и отправляю некоторые шаги на нем с использованием воздушного потока. Что...

A.B / 31 мая 2019
0 голосов
0 ответов

1) Я должен сравнить данные из таблиц из двух разных пространств клавиш Кассандры.Данные огромны в...

Ruhanika Tiwari / 31 мая 2019
1 голос
0 ответов

Я начал с моего академического проекта, который требует работы со Spark и MongoDB в качестве данных...

nouh Lazreq / 31 мая 2019
0 голосов
1 ответ

В моей таблице есть столбец с такими записями, как: this/is/my/dir/file this/is/my/another/dir/file...

Pluto / 31 мая 2019
0 голосов
1 ответ

У меня есть простое Java-приложение Spark (SimpleApp.jar), которое я пытаюсь запустить с помощью...

user3693309 / 30 мая 2019
1 голос
1 ответ

Я хочу найти продолжительные метки времени в действительно большом наборе данных. Это необходимо...

Joris / 30 мая 2019
0 голосов
1 ответ

Запрос Spark SQL for Create похож на this - CREATE [TEMPORARY] TABLE [IF NOT EXISTS] [db_name

Anirban Nag 'tintinmj' / 30 мая 2019
1 голос
1 ответ

Я создаю столбец time_interval и добавляю его в существующий фрейм данных в Pyspark . В идеале...

Guy / 30 мая 2019
1 голос
2 ответов

Я работаю в pyspark 2.3 и пытаюсь найти наиболее эффективный способ получения совокупной статистики...

flyingmeatball / 30 мая 2019
0 голосов
1 ответ
0 голосов
1 ответ

Сначала я использую оконную функцию, сортирую мою таблицу t1 по charge_time и ставлю t1 объединение...

piperck / 30 мая 2019
0 голосов
0 ответов

Я работаю над настройкой серверов ноутбуков Jupyter в Kubernetes, которые могут запускать pyspark....

PMende / 30 мая 2019
3 голосов
0 ответов

Я выполняю сценарий ETL Spark, который работает с файлами JSON.В этих файлах есть много массивов,...

Richard Nemeth / 30 мая 2019
0 голосов
0 ответов

У меня есть таблица в Hadoop, которая содержит 7 миллиардов строк, которые могут содержать что...

Tundra123 / 29 мая 2019
2 голосов
1 ответ

Вот так выглядит мой набор данных: +---------+------------+-----------------+ | name |request_type|...

Developer87 / 29 мая 2019
0 голосов
0 ответов

Получение исключения Unirest Config, когда я использую Java с Unirest API для вызова веб-службы...

user3438332 / 29 мая 2019
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...