Я изучаю массивные данные, а затем применяю PCA и tSNE для полных данных для извлечения шаблонов / кластеров. например образцы в функции = (1,000,000 * 1,000)
, затем 50 ПК (1,000,000 * 50)
и tSNE встраивание в 2d (1,000,000 * 2)
.
Затем я выбрал данные с весами, например, сэмплы на элементы = (10,000 * 1,000)
и веса сэмплов = (10,000 * 1)
, сейчас PCA (10,000 * 50)
, tSNE (10,000 * 2)
демонстрирует различные структуры и кластеры.
Можно ли в любом случае использовать PCA и tSNE для взвешенных образцов или процесс в порядке, только мне нужно рассмотреть стратегию отбора проб?
Спасибо