Шкала LDA границы решения - PullRequest
       111

Шкала LDA границы решения

0 голосов
/ 07 октября 2019

У меня довольно необычная проблема, и мне трудно найти решение этой проблемы. Буду очень признателен за вашу помощь.

У меня есть 4 гена (особенности), и моя классификация здесь бинарная (0 и 1). После долгих поисков я завершил использование LDA для своей классификации. У меня есть разные исследования, в каждом из которых сравниваются одни и те же два класса, и я тренировал свою модель, используя эти 4 гена в каждом из этих исследований.

Я хочу визуализировать оценки LDA в виде графика точек. Примерно так, как показано ниже, где каждый раздел представляет отдельное исследование / набор данных. Образцы этого набора данных по оси X и значения LD1, которое я получаю, - lda_model = lda(formula = class ~ ., data = train) predict(lda_model,train) по оси Y.

enter image description here Поскольку я обучал разные модели для каждого набора данных, мы можем четко видеть границу решения (которую я предполагаю, что это черная линия) для каждого набора данных различна и наразного масштаба. Однако я хочу масштабировать значения по оси Y таким образом, чтобы все мои наборы данных были в одном масштабе, и я могу представить этот график одной границей решения (опять же, что-то, что я могу четко нарисовать на графике, например,красная линия).

Здесь значения LD1 - a (GeneA) + b (GeneB) + c (GeneC) + d (GeneD) - среднее (a (GeneA) + b (GeneB) + c (GeneC) + d (GeneD)). Это делается для каждого набора данных в отдельности. Однако это не совсем равно (a (GeneA) + b (GeneB) + c (GeneC) + d (GeneD) + перехват), которое мы можем получить с помощью логистической регрессии. Я пытаюсь найти это значение или какой-нибудь метод, который может масштабировать мою ось Y по всем наборам данных, используя LDA.

Спасибо за вашу помощь!

1 Ответ

0 голосов
/ 15 октября 2019

Я сделал минимальное максимальное масштабирование, и это, похоже, сработало. Он масштабировал все мои точки данных по всем наборам данных с границей решения на нуле.

...