Относительно важности функций из скрытого пространства в обычное пространство - PullRequest
0 голосов
/ 16 февраля 2019

У меня есть большая (форма - (3000, 25000)) матрица, которую я уменьшил до (3000,2) представления с использованием t-SNE / UMAP, и наблюдал значительное увеличение производительности классификации в этом представлении.Тем не менее, я хотел бы быть в состоянии понять важность основных функций функций не в скрытом пространстве, а в обычном пространстве.Есть ли способ вернуться назад от скрытого представления и моего feature_importances_ (из моего случайного леса, построенного вокруг него) к базовым функциям?

1 Ответ

0 голосов
/ 17 февраля 2019

Краткий ответ - «нет».t-SNE работает, представляя локальные расстояния соседства в многомерном пространстве и затем пытаясь сохранить те же самые расстояния соседства в низкоразмерном пространстве.Поскольку он определяется только на основе расстояний и, более того, только близлежащих расстояний, нет четкого сопоставления между низкоразмерными направлениями и крупномерными элементами.

Более длинный ответ заключается в том, что вы можетеОтветьте на этот вопрос для окрестности в интерактивном смысле, выполнив что-то вроде этого:

a) Запустите t-SNE, получите низкоразмерное вложение, затем b) Выберите нужную вам точку и найдите ее (lowDсоседей) затем c) Запустите PCA на входных векторах большого размера для этих соседей

Первые несколько компонентов этого PCA покажут локально , какие функции высокого D наиболее важны.

Если вы попробуете это для множества разных точек и получите одинаковые функции высокого D, которые важны каждый раз, это говорит о том, что вы можете просто запустить PCA для своих входных данных и получить хорошее представление низкого D изчто.

Удачи!

...