Вопросы с тегом апаш-искра - PullRequest

Вопросы с тегом апаш-искра

0 голосов
1 ответ

Для простоты и в псевдокоде, если я делаю myDF = spark.read.option('inferSchema', True)

Joshua Cook / 12 февраля 2019
0 голосов
1 ответ

Я пытаюсь сгруппировать по одному столбцу DataFrame и генерировать значения min и max столбца...

Rick Haffey / 12 февраля 2019
0 голосов
1 ответ

Я пытаюсь использовать API структурированной потоковой передачи для подключения к кластеру Kafka,...

arosca / 12 февраля 2019
0 голосов
1 ответ

Что мне нужно сделать? Создать схему для DataFrame, которая должна выглядеть следующим образом:...

Andronicus / 12 февраля 2019
0 голосов
0 ответов

У меня есть avro-файл, выведенный из задания spark с некоторыми объектами в нем: Objavro

ThatComputerGuy / 11 февраля 2019
0 голосов
0 ответов

Я пытаюсь записать данные из моего приложения Pyspark в кластер Redshift, после того, как...

balalaika / 11 февраля 2019
0 голосов
0 ответов

У меня есть требование для запуска Spark в Windows в производственной среде.Я хотел бы получить...

user10264880 / 11 февраля 2019
0 голосов
1 ответ

У меня проблема с матрицами в Spark. Предположим, у меня есть RowMatrix с именем X, например: 0.5 0

rifqi mulyadi / 11 февраля 2019
0 голосов
1 ответ

У меня есть m2 СДР, состоящий из case class Medication(patientID: String, date: Date, medicine:...

Ekaterina Tcareva / 11 февраля 2019
0 голосов
1 ответ

У меня есть 2 больших фрейма данных, edge и vertex, и я знаю, что они должны быть в специальных...

Joe S / 11 февраля 2019
0 голосов
1 ответ
0 голосов
1 ответ

Я пытаюсь переместить данные из greenplum в HDFS с помощью Spark.Я могу успешно прочитать данные из...

Photon / 11 февраля 2019
0 голосов
4 ответов

Я начинающий со Spark, Hadoop и Yarn.Я устанавливаю Spark с: https://spark.apache.org/docs/2.3.0/ и...

THIBAULT Nicolas / 11 февраля 2019
0 голосов
0 ответов

Я выполняю классификацию изображений, используя фреймы данных spark растровые кадры .Я использую...

stacker / 11 февраля 2019
0 голосов
0 ответов

У меня есть Scala Spark DataFrame: id, content 1, "<p>Some paragraph</p>" 2,...

Ivan / 11 февраля 2019
0 голосов
1 ответ

Я новичок в Spark, мой пример использования - обработать файл 100 Гб в spark и загрузить его в куст

harshal pandit / 11 февраля 2019
0 голосов
2 ответов

Поворот не работает должным образом большую часть времени, т. Е. Увеличивает записи исходной...

Shyam / 11 февраля 2019
0 голосов
0 ответов

Я пытаюсь построить kd-деревья из точек в паре RDD с именем "RDDofPoints" с типом RDD [BoundingBox...

user3316676 / 11 февраля 2019
0 голосов
1 ответ

Я прочитал учетные записи из текстового файла, который использует , в качестве разделителя: val csv...

kn3l / 11 февраля 2019
0 голосов
1 ответ

Я пытаюсь настроить одно из значений столбца на основе значения в каком-либо другом фрейме данных

Alex / 11 февраля 2019
0 голосов
0 ответов

Мне нужно иметь два динамических совместно используемых кэша (в основном, типа hashmap) для...

Rahul Kumar / 10 февраля 2019
0 голосов
0 ответов

Я борюсь с реализацией производительной версии алгоритма SOM Batch в Spark / Pyspark для огромного...

MosbyT / 10 февраля 2019
0 голосов
0 ответов

можно запустить код pyspark, написанный локально в eclipse, на удаленном сервере, на котором...

Exorcismus / 10 февраля 2019
0 голосов
0 ответов

Я хочу сгруппировать различные распределения вероятностей в форме гистограмм.У меня есть набор...

MosbyT / 10 февраля 2019
0 голосов
1 ответ

У меня есть следующая таблица: DEST_COUNTRY_NAME ORIGIN_COUNTRY_NAME count United States Romania 15...

Manu Chadha / 10 февраля 2019
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...