Почему моя матрица коэффициентов линейного дискриминантного анализа 2x1, а не 2x2? - PullRequest
1 голос
/ 22 марта 2020

Я использую линейный дискриминантный анализ некоторых данных фондового рынка. Я слежу за лабораторией в главе 4 «Введение в статистическое обучение». Моя проблема связана с 2 предикторами (х переменных) и 2 классами, которым они могут быть назначены.

Я использую Scikit, чтобы научиться делать это. Однако при распечатке моей матрицы коэффициентов меня смущают ее размеры. Под коэффициентами я имею в виду коэффициенты, которые умножаются на значения предикторов в следующем уравнении:

enter image description here

Поскольку у меня есть 2 предиктора и 2 возможные классы в моей задаче, я ожидал бы, что эта матрица коэффициентов будет 2 x 2. Таким образом, 2 коэффициента на класс k - один для каждого предиктора. Тем не менее, согласно документации Scikit Learn, массив должен иметь следующую форму:

shape = [rank, n_classes - 1] (https://scikit-learn.org/0.15/modules/generated/sklearn.lda.LDA.html)

В моем случай ранг эквивалентен количеству предикторов у меня есть. Кто-нибудь может объяснить, почему количество столбцов равно n_classes - 1, а не просто n_classes?

...