Вопросы с тегом апаша-искра - PullRequest

Вопросы с тегом апаша-искра

0 голосов
0 ответов

Я хочу объединить данные из neo4j и hbase. После долгих поисков я решил сделать это с помощью...

Mahesha999 / 15 мая 2018
0 голосов
1 ответ

Я пытаюсь сделать это главным образом потому, что мне нужно сохранять данные из одного потока в две...

Ripley / 15 мая 2018
0 голосов
2 ответов

Почему следующий код имеет ошибку компиляции в операторе возврата, def getData(queries:...

Krishas / 15 мая 2018
0 голосов
1 ответ

У меня есть потребность, где я хочу при желании фильтровать данные. def test(df: DataFrame,...

Nick01 / 15 мая 2018
0 голосов
2 ответов

Кто-нибудь пробовал использовать библиотеку вероятностного программирования Python со Spark? Или у...

Nick Resnick / 14 мая 2018
0 голосов
2 ответов

В настоящее время я пытаюсь развернуть пример jar-файла jar в кластере Kubernetes, работающем в IBM...

Pascal / 14 мая 2018
0 голосов
1 ответ

У меня есть набор данных, который выглядит следующим образом: ~ ❯ head example.csv ix,value 1...

gberger / 14 мая 2018
0 голосов
2 ответов

Как можно развернуть массив внутри фрейма данных искры, чтобы результирующий фрейм данных содержал...

user152468 / 14 мая 2018
0 голосов
2 ответов

Если я перечислю все базы данных в Hive, я получу следующий результат (у меня есть 2 таблицы по...

Chems Bezzaz / 14 мая 2018
0 голосов
2 ответов

Файл Fasta является многолинейным файлом. Это структурировано как >ID_1 ACGTAGCATGC >ID_2...

xgaia / 14 мая 2018
0 голосов
1 ответ

У нас есть 3-узловый искровой EMR-кластер (m3Xlarge). Мы пытаемся объединить несколько больших...

deepak spark / 14 мая 2018
0 голосов
1 ответ

Здравствуйте, я новичок в Stack OverFlow, это мой первый вопрос. Я работаю в Scala, и у меня есть...

Skiel / 14 мая 2018
0 голосов
1 ответ

Создает искровой кластер через консоль gcloud со следующими параметрами Кластеры gcloud dataproc...

Progmatix / 14 мая 2018
0 голосов
2 ответов

Я работаю над интеграцией spark-streaming с twitter, используя python API.В основном примеры или...

analyticalpicasso / 14 мая 2018
0 голосов
1 ответ

Spark dataframe, df, имеет следующие имена столбцов: scala> df.columns res6: Array[String] =...

shanlodh / 14 мая 2018
0 голосов
0 ответов

Я не знаю, как это объяснить, но Spark, кажется, добавляет скрытый (неявный?) Параметр в...

abufct / 14 мая 2018
0 голосов
1 ответ

Я пытаюсь настроить и запустить кластер Spark, работающий поверх YARN и использующий HDFS. Сначала...

Windsaw / 13 мая 2018
0 голосов
2 ответов

Я ищу pyspark-эквивалент pandas dataframe. В частности, я хочу сделать следующую операцию над...

wrek / 13 мая 2018
0 голосов
1 ответ

Я новичок в Искре. Я установил Spark 2.3.0 в Windows 10, чтобы использовать PySpark. Я написал код,...

Sarsoura / 13 мая 2018
0 голосов
1 ответ

Я читаю сотни XML-файлов в Spark Dataframe, где каждая строка состоит из метаданных и данных...

Trace Smith / 13 мая 2018
0 голосов
0 ответов

Я думаю, что, возможно, наткнулся на ошибку и хотел узнать мнение других людей. Я запускаю...

Antonio Ye / 12 мая 2018
0 голосов
2 ответов

У меня есть СДР, например: rdd = sc.parallelize(['a','b','a'...

YOLO / 12 мая 2018
0 голосов
1 ответ

введите описание изображения здесь Это API-документ, представленный на xgboost.com, кажется, что я...

Steve YN / 12 мая 2018
0 голосов
0 ответов

Когда я запускаю pyspark без sudo в командной строке в Ubuntu, я получаю следующую ошибку: Вам...

OmG / 12 мая 2018
0 голосов
2 ответов

Я установил R-3.4.0 и rstduio-сервер 1.1.447 в centOS.В rstudio я не могу подключить искру...

po_int / 12 мая 2018
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...