Глубокое обучение + музыка, генерация музыки с использованием GAN, как проигрывать песни из миди-изображений - PullRequest
0 голосов
/ 17 марта 2019

Я изучаю этот репозиторий: musegan и пытался его использовать.

Мой общий доступ Google Colab Link

Он выполняется, но я понятия не имею, где я могу получить сгенерированные музыкальные сэмплы или как я запускаю музыку. Он производит кучу .png изображений в папке ./exp/, но я не знаю, как это полезнодля создания музыки

даже в файле ReadMe этого проекта Results , если вы загрузите его, он даст кучу изображений.Я понятия не имею, как я могу использовать эти изображения.

Я новичок в ML и Deep Learning, я выбрал этот проект, потому что у меня есть интерес к музыке, и я хотел вдохновиться, какглубокое обучение решит эту проблему.

Я читал об ANN, RNN & CNN и GAN, но я нахожусь на очень низком уровне.Но я хочу научиться этому.

Я смотрел это видео владельца проекта, Видео Но оно на китайском, я использовал Переводчик Google (с китайского на английский) конвертировать аудио в текст на английском языке, но это был не очень хороший опыт.

Вот слайды: Слайд 1 Слайд 2

Я знаю, что это не лучший первый проект для выбора, но это то, что меня интересует, поэтому я буду более счастлив инвестировать свое время взнать об этом проекте.

Мой опыт работы в веб-разработке - как front-end, так и back-end.

1 Ответ

1 голос
/ 29 марта 2019

Вам необходимо найти файлы .npz и преобразовать их в формат midi следующим образом:

from pypianoroll import Multitrack

m = Multitrack('./test.npz')
m.write('./test.mid')

Они уже ответили на ваш вопрос в проблемах репозитория.К сожалению, этого пока нет в документации.

...