Я имею дело с задачами многоцелевой регрессии (сильно нелинейной). Я сталкиваюсь с ними, используя ИНС. Чтобы обучить их, мне нужно создать базу данных, требующую дорогостоящих в вычислительном отношении и требующих много времени моделирования. База данных обычно имеет n строк = ~ 1000 (каждая строка представляет собой симуляцию), 15
Я пробовал некоторые методы уменьшения размерности ( например, PCA), но они не привели к какому-либо удовлетворительному результату.
Я хотел бы знать, есть ли какие-либо методы увеличения данных, чтобы уменьшить количество симуляций, которые мне нужно сделать. Приветствуются любые мысли или советы.
Edit 1:
- Я пробовал вариативный автокодер, но они не работали хорошо. Стоит ли мне попробовать GAN?
- Я думал использовать kNN, но они бесполезны с данными больших размеров. Есть ли какие-нибудь улучшения kNN (или что-то подобное), которые я мог бы попробовать?