Я пытаюсь использовать ванильный автоэнкодер (вместо PCA), чтобы уменьшить размеры моих данных. Мои данные содержат 97 выборок с 23K-объектами, и главная цель - применить кластеризацию по этим 97 точкам. Поскольку эти точки имеют очень большие размеры, запуск К-средних сразу не будет хорошей идеей. Поэтому я решил сначала уменьшить размеры, а затем применить кластеризацию по K-среднему значению.
Я пробовал различные архитектуры для кодирования 23K-объектов с меньшими размерами, т.е. 100, 50, 20 и так далее. Каждый раз, я получаю некоторый вывод с функцией сходящихся потерь. Но я не получаю, как я могу подтвердить свой результат? Если бы это были данные изображения, я бы нарисовал входные и выходные изображения и сравнил их вручную, но здесь это просто табличные данные (плотные). Как мне проверить мою модель здесь? Любая помощь / предложения приветствуются.