Кластеризация по параметрам модели - PullRequest
0 голосов
/ 04 августа 2020

Я пытался выполнить кластеризацию на основе параметров модели SGD (Coefficient и Intercept). coef_ содержит веса w, а intercept_ содержит b. Как можно использовать эти параметры с кластеризацией (KMedoids) в группе изученной модели?

import numpy as np
from sklearn import linear_model
X = np.array([[-1, -1], [-2, -1], [1, 1], [2, 1]])
Y = np.array([1, 1, 2, 2])
clf = linear_model.SGDClassifier()
clf.fit(X, Y)

Итак, я хочу сделать кластеризацию на основе clf.coef_ (array([[19.47419669, 9.73709834]])) и clf.intercept_ (array([-10.])) для каждой изученной модели.

1 Ответ

0 голосов
/ 04 августа 2020

Создайте свой набор данных X для кластеризации, добавляя коэффициенты и массивы перехвата каждый раз после обучения модели, ie.:

X = np.vstack((X, np.hstack((clf.coeff_, clf.intercept_))))

После того, как вы загрузили все данные в X, подайте ему KMedoids model, ie.:

from sklearn_extra.cluster import KMedoids

kmed = KMedoids(n_clusters=N).fit(X)

Обратите внимание, что вы указали N, и вам, вероятно, следует проверить результаты кластеризации для ряда значений N, прежде чем выбирать лучший на основе одного или нескольких из показатели кластеризации .

...