Я использую линейный дискриминантный анализ некоторых данных фондового рынка. Я слежу за лабораторией в главе 4 «Введение в статистическое обучение». Моя проблема связана с 2 предикторами (х переменных) и 2 классами, которым они могут быть назначены.
Я использую Scikit, чтобы научиться делать это. Однако при распечатке моей матрицы коэффициентов меня смущают ее размеры. Под коэффициентами я имею в виду коэффициенты, которые умножаются на значения предикторов в следующем уравнении:
![enter image description here](https://i.stack.imgur.com/cW3ax.png)
Поскольку у меня есть 2 предиктора и 2 возможные классы в моей задаче, я ожидал бы, что эта матрица коэффициентов будет 2 x 2. Таким образом, 2 коэффициента на класс k - один для каждого предиктора. Тем не менее, согласно документации Scikit Learn, массив должен иметь следующую форму:
shape = [rank, n_classes - 1] (https://scikit-learn.org/0.15/modules/generated/sklearn.lda.LDA.html)
В моем случай ранг эквивалентен количеству предикторов у меня есть. Кто-нибудь может объяснить, почему количество столбцов равно n_classes - 1, а не просто n_classes?