Вопросы с тегом pyspark - PullRequest

Вопросы с тегом pyspark

0 голосов
0 ответов

Когда я запускаю следующий код в pyspark shell import pymongo_spark pymongo_spark.activate() rdd =...

onlyvinish / 06 ноября 2018
0 голосов
1 ответ

В настоящее время интеграция между структурами Spark и Dask кажется сложной при работе со сложными...

LetsPlayYahtzee / 06 ноября 2018
0 голосов
0 ответов

У меня есть DataFrame, где изначально у меня была строка с датами. Я преобразовал его в правильную...

cph_sto / 06 ноября 2018
0 голосов
1 ответ

Я новичок в работе с NoSQL базами данных. У меня Spark 1.6.0 на моем кластере, и мне нужно получить...

Vladimir Sazonov / 06 ноября 2018
0 голосов
1 ответ

Недавно я получил сообщение об ошибке «spark.driver.MaxResultSize». Я использую pyspark в режиме...

Dongqing / 06 ноября 2018
0 голосов
0 ответов

В моей работе pyspark я пытаюсь создать временную таблицу, используя предложение LIKE, как показано...

barath / 06 ноября 2018
0 голосов
1 ответ

Я использую MLP классификатор из pyspark.ml.classification . Я подгоняю свою модель MLP к набору...

merkle / 06 ноября 2018
0 голосов
1 ответ

Рассмотрим массивы, как показано здесь. У меня есть 3 набора массивов: Массив 1: C1 C2 C3 1 2 3 9 5...

Tekie.bigdata / 06 ноября 2018
0 голосов
1 ответ

У меня есть фрейм данных pyspark со столбцами «Имя» и «Среднее имя». Столбец среднего имени...

Umi / 06 ноября 2018
0 голосов
0 ответов

Я попытался установить ipython 1.2.1 с помощью этой команды: sudo easy_install ipython==1.2.1 но...

Dr. know / 06 ноября 2018
0 голосов
7 ответов

Я использую spark over emr и пишу скрипт pyspark, Я получаю сообщение об ошибке при попытке from...

thebeancounter / 05 ноября 2018
0 голосов
1 ответ

Я нашел этот билет apache-parquet https://issues.apache.org/jira/browse/PARQUET-686, который...

Nevermore / 05 ноября 2018
0 голосов
1 ответ

У меня есть фрейм данных pyspark, и я хотел бы разделить одну строку на другую в группах. Внутри...

LN_P / 05 ноября 2018
0 голосов
0 ответов

Я использую MultilayerPerceptronClassifier из pyspark.ml.classification Мой набор данных имеет 11...

merkle / 05 ноября 2018
0 голосов
0 ответов

Я пытаюсь обрабатывать добавочные данные в Pyspark. Ниже приведена текущая система. История имеет...

reader883 / 05 ноября 2018
0 голосов
4 ответов

У меня есть PySpark DataFrame. Как я могу отрубить / удалить последние 5 символов из столбца name...

cph_sto / 05 ноября 2018
0 голосов
1 ответ

Я пытаюсь использовать функцию udf на фрейме данных с pyspark, но получаю сообщение об ошибке в...

ikusi-makusi / 05 ноября 2018
0 голосов
0 ответов

У меня есть список массивов в памяти как часть RDD в приложении Spark. Я хочу сохранить каждый rdd...

dks551 / 05 ноября 2018
0 голосов
0 ответов

Я хотел бы знать, сколько задач создано для простого задания по подсчету слов для приведенного ниже...

akhil pathirippilly / 05 ноября 2018
0 голосов
2 ответов

У меня есть CSV, который не указан, добавил пример ниже Новые строки экранируются с помощью \, как...

Geethanadh / 05 ноября 2018
0 голосов
0 ответов

Мне нужно знать, зачем указывать ядра-исполнители для приложений spark, работающих на пряже....

Umar / 05 ноября 2018
0 голосов
2 ответов

Я хочу самый частый урок в каждой группе. В каждой группе может быть несколько строк, а также может...

pras / 04 ноября 2018
0 голосов
0 ответов

Я совершенно новичок в pyspark и застрял в проблеме. Я пытаюсь прочитать таблицу из улья и создать...

Danjeh / 04 ноября 2018
0 голосов
1 ответ

Мне нужно вычислить сходство Жакара всех пар строк текста. Я буду хотеть в выводе только пары со...

mychemicalro / 04 ноября 2018
0 голосов
0 ответов

У меня есть приложение Pyspark, которое в основном загружает файлы изображений где-то s3 и...

dks551 / 04 ноября 2018
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...