Как получить процент вероятности для model.predict () при кластеризации документов - PullRequest
0 голосов
/ 01 марта 2019
text = "Some random text string that I want to cluster"
Y = vectorizer.transform([text])
prediction = model.predict(Y)
print(prediction)

вышеприведенное проходит через значение, которое является строкой, а затем возвращает группу кластеров, к которой относится (один из трех).

Как узнать, какой процентточность его прогнозато есть.этот конкретный текст на 90% согласуется с группой 1, следующий текст может быть на 45% согласован с группой 2, но он все равно войдет в группу 2 тем не менее.Я хочу иметь возможность ловить предметы с низкой точностью.

1 Ответ

0 голосов
/ 04 марта 2019

Обычно совсем нет.

Даже некоторые (несколько) кластеров работают с некоторой вероятностью внутри и могут иметь функцию predict_proba для получения этих значений, эти значения скорее отражают относительную ответственность, чем точность.

...