Вопросы с тегом апаш-искра - PullRequest

Вопросы с тегом апаш-искра

1 голос
1 ответ

Я использую Paramiko для тестирования команд докера из внешней системы (мне нужно сделать это, я не...

M. Barbieri / 02 мая 2019
0 голосов
1 ответ

Я установил кластер AWS EMR, который включает в себя spark 2.3.2, hive 2.3.3 и hbase 1.4.7.Как...

Ari / 02 мая 2019
1 голос
1 ответ

(я новичок в Spark) Мне нужно хранить большое количество строк данных, а затем обрабатывать...

radumanolescu / 02 мая 2019
1 голос
1 ответ

Я пытался выполнять потоковую передачу и пакетирование из одной и той же дельта-таблицы, но...

Hubert Dulay / 02 мая 2019
1 голос
0 ответов
0 голосов
1 ответ

Я пытаюсь загрузить данные из таблицы Excel в таблицу кустов. Выдает ошибку ниже

Jagadeesh / 02 мая 2019
2 голосов
3 ответов

Я пытаюсь применить функцию к каждой строке Spark DataFrame, как в примере. val df = sc

Placidia / 02 мая 2019
2 голосов
1 ответ

У меня возникает следующая проблема: при печати выполненного плана я не могу просмотреть все...

Alessandroempire / 02 мая 2019
0 голосов
0 ответов

Я пытаюсь сохранить информацию о значении null в столбце после применения преобразования...

Mpizos Dimitris / 02 мая 2019
0 голосов
1 ответ

Я использую spark-cassandra-connector. Необходим для извлечения данных из таблицы оракулов. У меня...

Shyam / 02 мая 2019
0 голосов
2 ответов

У меня есть RDD [String] с этой формой: VAR1,VAR2,VAR3,VAR4, ... a , b , c , d , ... e , f , g , h ...

maxime rosano / 02 мая 2019
3 голосов
1 ответ

У меня есть датафрейм с тремя столбцами; ID, CO_ID и DATA, где столбец DATA имеет две разные схемы,...

Mohammad Sunny / 02 мая 2019
1 голос
2 ответов

Я новичок в Apache Spark и мне нужна помощь.Может кто-нибудь сказать, как правильно объединить...

Nurzhan Nogerbek / 02 мая 2019
1 голос
0 ответов

Планировщик емкости YARN может ставить в очередь задания на основе приоритета и тому подобное и...

aidan.plenert.macdonald / 02 мая 2019
1 голос
1 ответ

Я пытаюсь выбрать все элементы, присутствующие в foo, но не присутствующие в баре.Я использую этот...

Nothing / 01 мая 2019
1 голос
1 ответ

Я относительно новичок в Pyspark.У меня есть RDD, составленный из списка кортежей.Я хотел бы...

Gerrrald1 / 01 мая 2019
0 голосов
1 ответ

У меня довольно большой файл Parquet, который я загружаю с помощью file = spark.read

Tokyo / 01 мая 2019
2 голосов
2 ответов

Я пытаюсь сделать API Rest с помощью Akka. Одна из точек входа вернет данные из моей базы данных...

Max0u / 01 мая 2019
1 голос
3 ответов

Я хочу упорядочить по времени некоторые авро-файлы, полученные из HDFS. Схема моих файлов avro:...

Gatsby / 01 мая 2019
1 голос
2 ответов

Чем переворачивающееся окно в 5 секунд при обработке потока отличается от микропакета в 5 секунд...

Sheel Pancholi / 01 мая 2019
0 голосов
1 ответ

Я читаю csv-файл, используя scala для заполнения набора данных, и там я сталкиваюсь с проблемой...

Kunal Trivedi / 01 мая 2019
0 голосов
1 ответ

Я пытаюсь добавить featureD в виде массива Double в Vectors.dense функцию, но получаю эту ошибку:...

PHP Developer / 01 мая 2019
1 голос
1 ответ

Как запустить искру в режиме без головы?В настоящее время я выполняю спарк на HDP 2.6.4 (т.е. 2.2...

Georg Heiler / 01 мая 2019
0 голосов
1 ответ

Я пытаюсь отладить код от разработчика, который больше не работает в организации, использующей...

Luis Leal / 01 мая 2019
0 голосов
0 ответов

Я пытаюсь прочитать очень большой графический файл, который имеет формат: 1 2,3 3,2,1 7,4,3 4,3,4,6...

Rishabh Agrawal / 01 мая 2019
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...