Как ввести Scikit узнать MLP классификатор с переменной длиной входных данных. - PullRequest
0 голосов
/ 07 мая 2018

Я хочу запустить простой MLP Classifier (Scikit learn) со следующим набором данных.

Набор данных состоит из 100 файлов, содержащих звуковые сигналы.Каждый файл имеет два столбца (два сигнала) и строки (длина сигналов).Длина строк (сигналов) варьируется от файла к файлу в диапазоне от 70 до 80 значений.Таким образом, размеры файла составляют от 70 x 2 до 80 x 2. Каждый файл представляет собой одну полную запись.

enter image description here

Проблема, с которой я сталкиваюсь, состоит в том, как обучить простой MLP с переменной длиной данных, с комплектом обучения и тестирования, содержащим 75 и 25 файлов соответственно.

Одним из решений является объединение всех файлов и создание одного файла, т.е. 7500 x 2, и обучение MLP.Но важная информация о сигналах больше не нужна в этом случае.

1 Ответ

0 голосов
/ 07 мая 2018

Три подхода в порядке полезности. Настоятельно рекомендуется подход 1.

1-й подход - LSTM / GRU

Вы не используете simple MLP. Тип данных, с которыми вы имеете дело - это последовательные данные. Рекуррентные сети (LSTM / GRU) были созданы для этой цели. Они способны обрабатывать последовательности переменной длины.

2-й подход - вложения

Найдите функцию, которая может преобразовать ваши данные в последовательность фиксированной длины, которая называется встраиванием. Примером сети, производящей внедрение временных рядов, является TimeNet . Однако это, по сути, возвращает нас к первому подходу.

3-й подход - заполнение

Если вы можете найти разумную верхнюю границу для длины последовательности, вы можете заполнить более короткие ряды длиной самой длинной (заполнить 0 в начале / конце ряда, интерполировать / спрогнозировать оставшиеся значения), или вырезать более длинные серии до длины самой короткой. Очевидно, вы либо внесете шум, либо потеряете информацию соответственно.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...