Классификация N x L пространства ввода (табличная форма) посредством машинного обучения - PullRequest
0 голосов
/ 04 марта 2012

Я немного искал в Google, но не могу найти четкого ответа.При обычных обстоятельствах обучающий набор размером M x N будет иметь форму (X (i), Y (i)), 1 <= i <= M, где X (i) представляет конкретную строку данных с Nвходные элементы (или размеры).Однако предположим, что у меня есть X (i) в форме N x L (2-мерная таблица).Следовательно, X имеет размерности M x N x L (элемент из R ^ (MxNxL)).Как мне подойти к этому?(Я надеюсь, что здесь есть смысл) </p>

В настоящее время я пытаюсь взять N значений в каждом из данных N x L (таблица) в X (i) и сопоставить его снекоторый набор уникальных чисел, который представляет значения N (стандартное отклонение, среднее значение и т. д.).Это изменяет размер X с размеров M x N x L на размеры M x L ​​(или M x 2L) и позволяет мне классифицировать соответственно.В настоящее время я использую NN-реализацию (буду изучать SVMS в ближайшие недели).

Любые предложения по этому конкретному вопросу (каждая обучающая информация в формате 2D таблицы) для улучшения моего алгоритма обучения будутс благодарностью.

Редактировать: Позвольте мне быть более точным в моих данных.Предположим, у меня есть 15 полей (L) и 200 (N) разных показаний этих полей в разное время (или на расстоянии).Например, рассмотрим проблему, когда человек проходит через детектор с 15 различными датчиками в течение 200 секунд.Следовательно, каждая строка данных в таблице N x L соответствует данным, полученным в каждую секунду.Следовательно, часто в каждом поле имеется кривая колокольчика для значений N с увеличением времени.Более того, каждая строка (в NxL) является условно зависимой.Классификация проводится для человека.

Если кто-то может описать мне псевдоалгоритм словами (а не только именами) для решения этой проблемы, это было бы замечательно.

1 Ответ

1 голос
/ 04 марта 2012

Сложно ответить, не зная некоторых особенностей размеров. Было бы непомерно сгладить ваши массивы N x L в длинный массив N '? Я использую этот подход, например, для изучения данных изображений, которые могут обеспечить достаточную производительность, если на вашей машине достаточно ресурсов, а изображения достаточно малы (скажем, 50 на 50 пикселей должно работать нормально даже в наивной реализации).

Вы также можете изучить возможность уменьшения размерности (например, анализ основных компонентов) ваших данных. Если ваш NN по-прежнему хорошо классифицируется даже после сжатия ваших 2d объектов в 1d (стандартные отклонения, как вы упомянули), похоже, у вас есть некоторая избыточность в ваших функциях.

...