PCA для построения индекса.Проблема со знаком - PullRequest
0 голосов
/ 22 ноября 2018

Я использую R (RStudio) для создания индексного / синтетического индикатора для оценки, скажем, коммерческой эффективности.Я использую команду PCA () из пакета factorMineR и использую 7 различных переменных.Ранее я создавал аналогичные индексы, рассчитывая вес каждой конкретной переменной по первому компоненту (который можно получить с помощью PCA () $ var $ordin [, 1]), без проблем, поскольку каждая переменная имеет положительный вес.Однако есть одна конкретная переменная, которая имеет вес с нежелательным знаком: отрицательный.Переменная - «скорость доставки», и этот знак будет означать, что чем выше скорость, тем менее эффективен процесс.Тогда что происходит?Как бы вы исправили эту проблему, желательно с помощью PCA?

1 Ответ

0 голосов
/ 22 ноября 2018

Знак переменного веса не должен иметь значения в PCA.Поскольку в целом все компоненты отлично представляют исходные данные (когда p нежелательный вес, скорее, что для этого конкретного извлеченного сигнала (скажем, первого главного компонента) вес переменной является отрицательным.

Для лучшего понимания, давайте возьмем классический двухмерный пример, который я взял из этого очень полезного обсуждения :

enter image description here

Можете ли вы увидеть на графике, что один из весов будет необходим для отрицательного значения для 2-го главного компонента?

Наконец, если эта переменная действительно мешает вашему анализу, одним из возможных решений будет применениеРазреженный спс.При перекрестной проверке регуляризации этот метод может сделать некоторые веса равными нулю.Если в вашем случае этот отрицательный вес не является достаточно значительным, он может быть уменьшен до нуля при SPCA.

...