использование ConvLSTM для классификации (узнайте, была ли песня сделана певцом X) - PullRequest
1 голос
/ 13 октября 2019

Моя задача - сделать модель, предсказывающую, была ли данная песня написана ранее указанным певцом (скажем, Элвисом Пресли) или нет. После прочтения файла в формате flac я применил MFCC и вернул 2-мерный ndarray. Моя идея заключалась в том, чтобы использовать слои конвоя для масштабирования данных, а затем LSTM для прогнозирования на основе порядка звуков в мелодии.

Проблема в том, что ввод lstm основан на последовательности выходных данных модели (а не на каждом звуке). вывод) так что он работает на основе порядка песен (поправьте меня, если я не прав). Нужно ли менять форму набора данных или пробовать что-то еще?

Я знаю, что этот convLSTM может вообще не работать, но я действительно хочу увидеть результаты.

...