Вопросы с тегом апаш-искра - PullRequest

Вопросы с тегом апаш-искра

2 голосов
1 ответ

Я пытаюсь изменить версию spark 2.2.1 на 2.4.0 В спарке 2.2, после работало нормально. val query =...

Hacking J / 31 марта 2019
0 голосов
0 ответов

Мы запускаем кластер Spark в режиме высокого параллелизма.ETL происходит каждый день (с...

Sam / 31 марта 2019
0 голосов
0 ответов

Я создаю Spark Streaming Application и хочу обрабатывать каждое сообщение Кафки отдельно. Сейчас я...

Alex Strong / 31 марта 2019
2 голосов
1 ответ

Я пытаюсь создать список из структурного типа во фрейме Spark Data. Схема выглядит примерно так...

Prateek / 31 марта 2019
1 голос
1 ответ

В разных контейнерах выполняются две задачи потокового воспроизведения - назовем их работой учителя...

EbbnFlow / 30 марта 2019
0 голосов
0 ответов

Как вы можете объяснить следующий результат выполнения предгеля spark graphx? В искровом кластере...

kboom / 30 марта 2019
0 голосов
1 ответ

Как я могу получить все имена массивов в Dataframe? Проблема в том, что я пытаюсь взорвать ВСЕ...

J-kram / 30 марта 2019
0 голосов
0 ответов

Я пытаюсь прочитать файл журнала apache и пытаюсь поместить его в dataframe после синтаксического...

maddy / 30 марта 2019
0 голосов
0 ответов

Я отлаживаю искровое приложение: val rdd1 = sparkContext.makeRDD(keyValueDataList1).partitionBy(new...

maxl1971 / 30 марта 2019
0 голосов
2 ответов

Если у меня есть кластер из 5 узлов , каждый узел имеет 1 ГБ оперативной памяти , теперь, если мой...

intellect_dp / 30 марта 2019
0 голосов
1 ответ

У меня есть плоская карта, которая возвращает последовательность Seq((20,6),(22,6),(23,6),(24,6)...

varun / 29 марта 2019
0 голосов
0 ответов

Я пытаюсь подключить MS Power BI к локальному сеансу Spark (все это происходит на компьютере с...

user5664778 / 29 марта 2019
2 голосов
3 ответов

Я использую spark с Scala для преобразования Dataframe, где я хотел бы вычислить новую переменную,...

Amit / 29 марта 2019
0 голосов
0 ответов

Поскольку я хочу извлечь данные из .doc файлов с помощью apache Tika, я запускаю следующий код:...

Iriel / 29 марта 2019
0 голосов
0 ответов

Мы обучаемся выполнять анализ настроений на данных в Твиттере с помощью Hadoop, и мы получаем...

S.P / 29 марта 2019
0 голосов
0 ответов

Я пишу DataFrame в Redshift, используя временную корзину s3 и Parquet в качестве временного формата

alexanoid / 29 марта 2019
0 голосов
1 ответ

Я новичок в машинном обучении и пытаюсь изучить его, используя scala и spark в локальном режиме,...

harshal pandit / 29 марта 2019
1 голос
0 ответов

У меня есть постоянный набор данных MEMORY_AND_DISK_2, я использую фактор репликации, чтобы...

minsky / 29 марта 2019
0 голосов
1 ответ

Я пытаюсь соединить искру и Кассандру, используя спарк-кассандра-разъем. соединение устанавливается...

Shreya Mahajan / 29 марта 2019
0 голосов
0 ответов

В настоящее время пытаются записать большое количество (7,5 миллионов) файлов json из s3 в...

Zillah / 29 марта 2019
0 голосов
1 ответ

Я использую Spark SQL 2.1, Я могу читать данные из mysql / oracle как временное представление в...

Tom / 29 марта 2019
0 голосов
0 ответов
0 голосов
1 ответ

У меня есть СДР из множества предметов, просто упростить это нравится: [0,1,2,3,4,5,6,7,8,9] и...

jmuok / 29 марта 2019
0 голосов
2 ответов

Приветствие Я создал кластер Spark 2.1.1 в Amazon EC2 с экземпляром типа m4.large, состоящим из 1...

catalino / 29 марта 2019
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...