Вопросы с тегом апаш-искровой mllib

0 голосов

0 ответов

Как сохранить модель ML, написанную в pyspark, в формате pickle (.pkl)?

Я написал модель ml, используя Spark MLLib в pyspark.Я хочу сохранить файл моей модели в моей...

Yashwanth Madaka / 13 марта 2019

0 голосов

0 ответов

Из чего состоит executorRunTime в Spark?

В настоящее время работая над Spark, я собрал некоторые метрики производительности с помощью...

YACINE GACI / 12 марта 2019

0 голосов

0 ответов

Массив значений функций Spark-ML RandomForestClassifier, показывающий все нули

Я пробовал PySpark RandomForestClassifier при определении важности объектов, и я был озадачен,...

nicholas_law_91hotmailcom / 12 марта 2019

0 голосов

1 ответ

Java SparkML линейная регрессия

Я пытаюсь проверить пример, данный spark, относительно алгоритма машинного обучения линейной...

Bîrsan Octav / 11 марта 2019

0 голосов

1 ответ

PySpark AttributeError: тип объекта «ALS» не имеет атрибута «trainImplicit»

Я пытаюсь обучить свой набор данных, используя ALS, чтобы найти скрытые факторы.Мой набор данных...

Gui Kham / 09 марта 2019

0 голосов

0 ответов

Я не могу прикрепить идентификатор клиента к прогнозу в Sparkml

Я реализовал алгоритм iforest в Spark / scala. Когда я пытаюсь передать свой набор тестовых данных...

user10812455 / 07 марта 2019

0 голосов

0 ответов

PYSPARK: применить квантильный дискретизатор для всех столбцов

Предположим, у меня есть 1000 столбцов. Как применить QuantileDiscretizer для всех столбцов? Это...

priya / 06 марта 2019

0 голосов

0 ответов

Влияет ли количество элементов в столбце рейтинга на эффективность совместной фильтрации на основе факторизации матрицы?

Я использую неявное предпочтение mllib реализация совместной фильтрации для генерации рекомендаций...

chetna bansal / 05 марта 2019

0 голосов

1 ответ

Восстановите Матрицу из компонентов SVD с помощью Pyspark

Я работаю над SVD, используя pyspark.Но в документации , как и в любом другом месте, я не нашел,...

arijit / 02 марта 2019

0 голосов

0 ответов

Как получить основную информацию о случайном лесу назад (pyspark 2.3 mllib) (разделенное значение, левый | правый дочерний узел, пакетирование ...)

Как получить основную информацию о случайной модели Форрест?Я хотел бы знать, какие экземпляры он...

Dieter / 28 февраля 2019

0 голосов

1 ответ

Ошибка десериализации Apache Spark Throwing при использовании метода take на RDD

Я новичок в Spark, и я использую Scala 2.12.8 с Spark 2.4.0.Я пытаюсь использовать классификатор...

The_Mad_Geometer / 26 февраля 2019

0 голосов

1 ответ

Как распределить учебные задания равномерно между исполнителями?

Я установил автономный кластер с 4 рабочими (у каждого по 4 ядра) и 1 мастером.У каждого есть окно...

GTR TOGTOKH / 26 февраля 2019

0 голосов

1 ответ

Spark MLlib: PCA на 9570 столбцах занимает слишком много времени

1) Я делаю PCA на 9570 столбцах, предоставляя ему 12288 МБ ОЗУ в локальном режиме (что означает...

Des0lat0r / 22 февраля 2019

0 голосов

0 ответов

Алгоритмы Pyspark.ml.classification или Regression содержат параметр Maxiter, что он делает？

Какова роль Param MaxIter ?Это максимальное количество итераций для запуска алгоритма оптимизации

luque Y / 21 февраля 2019

0 голосов

1 ответ

Я не могу приспособить модель FP-Growth к искре

Пожалуйста, вы можете мне помочь?У меня есть набор данных из 80 файлов CSV и кластер из одного...

Malik Berrada / 20 февраля 2019

0 голосов

1 ответ

StreamingKMeans setSeed ()

Мне нужно обучить StreamingKMeans с определенным значением для семени.Когда я запускаю val km = new...

Ekaterina Tcareva / 15 февраля 2019

0 голосов

0 ответов

Домашнее использование кукушки вместо молотка лучше, когда все мои бобы целые числа?

Почему использование cuckoobird вместо головки молотка дает мне лучшие результаты, когда все мои...

John Lee / 13 февраля 2019

0 голосов

1 ответ

Столбец Spark RowMatrixСходства сохраняют исходный индекс

У меня есть следующий фрейм данных Scala Spark df из (String, Array[Double]): Примечание id имеет...

Ivan / 12 февраля 2019

0 голосов

1 ответ

Как конвертировать RowMatrix в локальную матрицу?

У меня проблема с матрицами в Spark. Предположим, у меня есть RowMatrix с именем X, например: 0.5 0

rifqi mulyadi / 11 февраля 2019

0 голосов

0 ответов

java.lang.ClassCastException в удаленной работе искры

У меня проблема при отправке задания на спарк, работающий на пряже, у меня работает простой код:...

m scorpion / 09 февраля 2019

0 голосов

0 ответов

Вычислить стоимость StreamingKMeans

Мой код использует класс StreamingKMeans для кластеризации потоковых данных из kafka.Я хочу...

andrea5 / 08 февраля 2019

0 голосов

0 ответов

Apache Spark Mllib StringIndexer невидимые метки во время посадки

Я использую spark 2.2.0 для процесса ETL, а mlllib StringIndexer создает невидимое исключение метки...

o11306650 / 07 февраля 2019

0 голосов

0 ответов

Непоследовательная репликация счетчика векторизатора

У меня проблемы с несовместимостью Countvectorizer пакета функций ml.Когда я воспроизводю...

raffaelo92 / 05 февраля 2019

0 голосов

0 ответов

Как сохранить модель Spark Mllib KMeans?model.save приводит к пустым папкам

У меня есть источник потока, и я сначала пытаюсь получить модель K-средних кластеризации.Позже я...

user1384205 / 31 января 2019

0 голосов

0 ответов

Spark Random Forest Regressor: как получить оценку каждого дерева в лесу?

Я использую pyspark с алгоритмом MLLIB RandomForest. Алгоритм случайного леса из MLLIB дает только...

Adrien Forbu / 24 января 2019