Я использую алгоритм k-mode для кластеризации набора данных грибов. Я хочу оценить результат по меркам энтропии и чистоты; Как я могу это сделать?!
Это код для кластеризации:
import pandas as pd
from sklearn.preprocessing import LabelEncoder
from sklearn.metrics import confusion_matrix
from kmodes.kmodes import KModes
from scipy.stats import entropy
data = pd.read_csv(".../DS.csv")
lbl = LabelEncoder()
for col in data.columns:
data[col] = lbl.fit_transform(data[col])
y = data['class']
km = KModes(n_clusters=2, init='Huang', n_init=2)
y_pred = km.fit_predict(data)
mat = confusion_matrix(y, y_pred)
Это матрица путаницы:
[[4465 23]
[ 962 2966]]
Как я могу использовать scipy.stats .энтропия для вычисления энтропии?