Уменьшение размера для SVM в сенсорной сети - PullRequest
1 голос
/ 29 декабря 2010

Я ищу несколько предложений по проблеме, с которой я сейчас сталкиваюсь.

У меня есть набор датчиков, скажем, S1-S100, который срабатывает при выполнении какого-либо события E1-E20.Предположим, что обычно триггеры E1 S1-S20, триггеры E2 S15-S30, триггеры E3 S20-s50 и т. Д. И E1-E20 являются полностью независимыми событиями.Изредка событие E может вызывать любой другой не связанный датчик.

Я использую ансамбль из 20 мкм для анализа каждого события в отдельности.Мои функции включают частоту датчика F1-F100, количество срабатываний каждого датчика и несколько других связанных функций.

Я ищу метод, который может уменьшить размерность функции датчика (F1-F100) / илинекоторые методы, которые охватывают весь датчик и также уменьшают размерность (я искал некоторую концепцию теории информации в последние несколько дней).Я не думаю, что усреднение, максимизация - это хорошая идея, так как я рискую потерять информацию (это не дало мне хорошего результата).

Может кто-нибудь подсказать, что мне здесь не хватает?Бумага или какая-то начальная идея ...

Заранее спасибо.

Ответы [ 2 ]

2 голосов
/ 29 декабря 2010

Возможно, вы захотите начать с Линейный дискриминантный анализ , это довольно простой алгоритм, который делает более или менее то, что вы ищете: уменьшение размерности и / или классификация.Предполагается, что каждый класс распределен по Гауссу различными способами, но с одинаковой ковариацией.Вероятно, было бы неплохо подготовить некоторые данные заранее, чтобы убедиться в обоснованности этого предположения.Я использовал реализацию LDA в R раньше.Это было около десятка функций, однако.Я не уверен, как он будет масштабироваться до 100 измерений.

Может также помочь узнать, почему вы хотите уменьшить размерность данных.SVM обычно используются с сотнями тысяч (разреженных) функций, так в чем же сложность у вас?

0 голосов
/ 03 января 2011

Это отличная статья, связанная с вашим вопросом: http://en.wikipedia.org/wiki/Nonlinear_dimensionality_reduction

Кроме того, как @StompChicken упоминает, у вас не должно возникнуть никаких проблем, чтобы SVM работал с несколькими сотнями функций. Вы должны начать видеть (эксплуатационные) проблемы в десятках тысяч функций.

Carlos

...