Может кто-нибудь объяснить, как интерпретировать coefficientMatrix
, interceptVector
, Confusion matrix
из multinomial logistic regression
.
Согласно документации Spark:
Мультиклассовая классификация поддерживается посредством многочленной логистической (softmax) регрессии.В полиномиальной логистической регрессии алгоритм создает K наборов коэффициентов или матрицу размерности K × J, где K - количество классов результатов, а J - количество признаков.Если алгоритм соответствует члену перехвата, тогда доступен вектор перехватов длины K.
Я использовал пример с использованием spark ml 2.3.0 и получил этот результат.
.
Если я проанализирую, что я получу:
* coefficientMatrix
имеет размерность 5 * 11
interceptVector
имеетразмерность 5
Если да, то почему the Confusion matrix
имеет размерность 4 * 4
?
Кроме того, кто-нибудь может дать толкование coefficientMatrix
, interceptVector
?
Почему я получаю отрицательные коэффициенты?
Если 5 - это число классов после классификации, почему я получаю 4 строки в the confusion matrix
?
РЕДАКТИРОВАТЬ
Я забыл упомянуть, что я все еще новичок в машинном обучении и что мой поиск в Google не помог, так что, возможно, я получу Голосование вверх:)