Скажем, у человека есть программа, которая выполняет PCA.Программа рассчитывает количество компьютеров, необходимых для покрытия заданной доли общего отклонения в данных, например, 95%.
Скажем, количество компьютеров, необходимых для покрытия 95% отклонения, равно 10 дляданные, используемые в момент времени t = 1.
При t = 2 мы перезапускаем программу с данными из t = 2.Для t = 2 количество ПК, необходимых для покрытия 95% дисперсии, равно 5.
Следовательно, количество ПК, необходимых для покрытия 95% дисперсии, уменьшилось с 10 до 5 с t= 1 к t = 2.
Основной вопрос:
Можем ли мы сделать какие-либо выводы об изменении данных с t = 1 на t = 2 в этом случае?
Пример:
Можем ли мы сказать что-то вроде: «Поскольку число компьютеров уменьшается с t = 1 до t = 2, в данных больше корреляцииt = 1, чем при t = 2. Чем больше корреляция в данных, тем меньше ПК требуется для покрытия определенной доли данных в данных. "