Вы затрагиваете более общий момент, который, хотя и используется на практике все время, редко упоминается явно, даже в учебниках и вводных экспозициях.Хотя такого вопроса мне никогда не приходило в голову, с точки зрения новичка он имеет смысл (новички обычно свободны от некоторых условностей, которые более опытные практикующие принимают как должное, и зачастую они даже не замечают их ...).
Обычно, когда мы выбираем нет.из основных компонентов (например, для уменьшения размерности, визуализации и т. д.) мы выбираем число k
, и неявно оно подразумевается «начать с ПК1 и продолжить последовательно , вплоть до (и включая) PCk».Таков принцип, скажем, за функцией preProcess
пакета caret
в R (и, возможно, за всеми функциями, выполняющими аналогичные задачи, в любом программном пакете).
InДругими словами, и, насколько мне известно, по крайней мере, в таких случаях, как тот, который вы описываете, мы никогда не выбираем ПК с помощью cherrypicking (т. е., например, PC2, PC4 и PC5).Вместо этого мы всегда выбираем k < n
(здесь n=5
), а затем приступаем к всем первым k
ПК, т.е. начиная с ПК1 и далее.