Войти

Запомнить

Регистрация

Лента
Топ
Теги
Новая

Daniel Israel 11 июля 2019 22

Реализация алгоритма кластеризации документов в sagemaker

0 голосов

Daniel Israel / 11 июля 2019

Я пытаюсь реализовать алгоритм кластеризации документов k-средних в SageMaker. Несколько вопросов:

-Как я могу автоматизировать и оптимизировать количество сформированных кластеров?

-Какую наилучшую меру сходства текста использовать в этой ситуации?

-Есть какие-нибудь существующие реализации ноутбуков, на которые я могу сослаться?

Спасибо.

Python
алгоритм
кластер-анализ
K-средства
амазонка-sagemaker

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.

Похожие темы

ClientError: Невозможно проанализировать CSV K-средства в SageMarker
Amazon SageMaker kMeans не будет принимать разреженную матрицу (csr_matrix) в качестве входных данных, какие-либо альтернативы перед использованием плотной матрицы?
TypeError: объект 'int' не может быть подписан: при указании количества кластеров
вычислить K-средства после PCA
Как работать с функциями с уникальными значениями для кластеризации
Очень грязный результат после выполнения k-средних в стеке изображений в rstudio
Каков эквивалентный API tf.contrib.factorization.KMeans в TensorFlow 2.0?
как график Kmeans?
Код Kmeans для 3-х измерений с моим собственным ограничением в Matlab
Как найти лучшие термины в кластерах dbscan или hdbscan?

...