Я использую многозначную логистическую c регрессию в pyspark.
У меня есть 3 класса 0,1 и 2
Я сослался на ссылку ниже для объяснения. Однако из моих выводов у меня есть еще несколько вопросов. Пожалуйста, отметьте
Интерпретация матрицы коэффициентов, interceptVector и Confusion для мультиномиальной логистики c регрессия
Ниже моя переменная ответа закодирована как
|label|nps_category|
|1.0 |Low |
|2.0 |Medium |
|0.0 |High |
Ниже представлена плотная матрица, преобразованная во фрейм данных. Снизу a, b, c - это функции, а значения - это ее матричные коэффициенты.
|a|b|c
|-0.1437293719469877 |0.14376690138897105 |-0.3365062932684657
|0.24949364699076101 |-0.12324292572541203 |0.41774827297026096
|-0.10257959384745327 |-0.005988852052928155 |-0.07248360537016586
|-0.0031846811963206377|-0.014535123610635567 |-0.008758374331629884
Интерпретация матрицы коэффициентов, перехвата и вектора путаницы при многочленной логистике c регрессия
Ниже приведены мои вопросы по вышеприведенному выводу
1) Я хотел бы понять, почему есть 4 строки. Если я правильно понимаю, Из ссылки выше сказано, что каждая строка соответствует одной модели. Я хотел бы знать параметр, который необходимо установить pyspark
2) Как мне узнать, что значения коэффициентов матрицы соответствуют 0,1 или 2 классам.
Пожалуйста, не игнорируйте помощь меня в этом понимании. Если будут еще вопросы, я отвечу
Пожалуйста, помогите мне в понимании