PCA в наборе данных, чтобы уменьшить размерность и показать потерю информации - PullRequest
0 голосов
/ 19 февраля 2020


У меня есть набор данных, в котором имеется 50 объектов, что означает 50-мерный набор данных. Мне нужно уменьшить размерность набора данных и проверить, сколько информации теряется / остается после запуска PCA для набора данных. Я должен принять показания результата каждый раз. например, если я уменьшу измерение до 45 с 50, то сколько информации будет потеряно, а если я уменьшу до 40, то сколько потеряно и так далее. Я просто новичок в этой области, поэтому было бы здорово, если бы какое-либо указание или решение было дано с небольшим объяснением того, что происходит. Пока что я
взял набор данных в кадре данных. затем использовал метод StandardScaler.fit_transform () для нормализации. Затем рассчитали ковариационную матрицу и получили собственные значения и собственные векторы.
Было бы здорово узнать, каким будет следующий шаг, если я пойду в правильном направлении или каков будет правильный способ получить результаты. Спасибо.
PS: я использую python3 на pycharm ide.

...