Трехмерная матрица для машинного обучения / логистической регрессии - PullRequest
0 голосов
/ 23 декабря 2018

Мне интересно, пытался ли кто-нибудь использовать 3-мерную матрицу для логистической регрессии?Я работаю над проектом, который включает аудио, где для матрицы X размер n - это особенности для каждого аудиосэмпла, а размер m - это количество аудиофайлов, которые я сравниваю друг с другом.Проблема, с которой я сталкиваюсь, заключается в том, что для каждого аудиофайла существует множество аудиосэмплов (каждые 44100 сэмплов я буду принимать за «1 сэмпл»), каждый из которых включает в себя каждую отдельную функцию.Вместо того, чтобы просто брать среднее значение каждой функции для каждого аудиосэмпла, я подумывал добавить третье измерение в матрицу, как описано выше, то есть аудиосэмплы.Дело в том, что я не знаю, как это выдержит логистическую регрессию / что я могу ожидать от моих выходных переменных y.Кто-нибудь имеет какой-либо опыт с этим?

Результат, который я ищу, это способ взять все функции из каждого аудиосэмпла и сравнить несколько аудиофайлов, чтобы придумать алгоритм, который может определить «хороший»"аудио микширование из" плохого "аудио микса, поэтому я верю (хотя я не уверен), что я имею дело только с двумя выходными классами (хорошим или плохим).

Спасибо за совет

1 Ответ

0 голосов
/ 24 декабря 2018

Поскольку вы имеете дело с аудиовходом, вам, вероятно, следует использовать модель, которая была разработана для обработки последовательностей (аудио = последовательность кадров).

Я ожидаю, что (скажем,) обучение LSTM аудиоСигнал будет выполнять как минимум так же хорошо, как логистическая регрессия, обученная на среднем кадре.Тем не менее, обучение может занять гораздо больше времени.

Возможно, вы захотите начать с одного из проектов github, перечисленных в разделе: https://github.com/topics/audio-classification (я никогда не использовал ни одного из них).

...