Интерпретировать pyspark logisti c матрицу выходных коэффициентов регрессии с помощью нескольких классов - PullRequest
0 голосов
/ 26 мая 2020

Я использую многозначную логистическую c регрессию в pyspark.

У меня есть 3 класса 0,1 и 2

Я сослался на ссылку ниже для объяснения. Однако из моих выводов у меня есть еще несколько вопросов. Пожалуйста, отметьте

Интерпретация матрицы коэффициентов, interceptVector и Confusion для мультиномиальной логистики c регрессия

Ниже моя переменная ответа закодирована как

|label|nps_category|

|1.0  |Low         |
|2.0  |Medium      |
|0.0  |High        |

Ниже представлена ​​плотная матрица, преобразованная во фрейм данных. Снизу a, b, c - это функции, а значения - это ее матричные коэффициенты.

|a|b|c

|-0.1437293719469877   |0.14376690138897105       |-0.3365062932684657  
|0.24949364699076101   |-0.12324292572541203      |0.41774827297026096  
|-0.10257959384745327  |-0.005988852052928155     |-0.07248360537016586 
|-0.0031846811963206377|-0.014535123610635567     |-0.008758374331629884

Интерпретация матрицы коэффициентов, перехвата и вектора путаницы при многочленной логистике c регрессия

Ниже приведены мои вопросы по вышеприведенному выводу

1) Я хотел бы понять, почему есть 4 строки. Если я правильно понимаю, Из ссылки выше сказано, что каждая строка соответствует одной модели. Я хотел бы знать параметр, который необходимо установить pyspark

2) Как мне узнать, что значения коэффициентов матрицы соответствуют 0,1 или 2 классам.

Пожалуйста, не игнорируйте помощь меня в этом понимании. Если будут еще вопросы, я отвечу

Пожалуйста, помогите мне в понимании

...