Как рассчитать энтропию кластеризации k-мод в python - PullRequest
0 голосов
/ 14 июля 2020

Я использую алгоритм k-mode для кластеризации набора данных грибов. Я хочу оценить результат по меркам энтропии и чистоты; Как я могу это сделать?!

Это код для кластеризации:

import pandas as pd
from sklearn.preprocessing import LabelEncoder
from sklearn.metrics import confusion_matrix
from kmodes.kmodes import KModes
from scipy.stats import entropy

data = pd.read_csv(".../DS.csv")

lbl = LabelEncoder()
for col in data.columns:
    data[col] = lbl.fit_transform(data[col])

y = data['class']

km = KModes(n_clusters=2, init='Huang', n_init=2)
y_pred = km.fit_predict(data)

mat = confusion_matrix(y, y_pred)

Это матрица путаницы:

[[4465   23]
 [ 962 2966]]

Как я могу использовать scipy.stats .энтропия для вычисления энтропии?

...