Я занимаюсь разработкой нейронной сети для создания музыки.Нейронная сеть будет двухслойной LSTM (долговременная кратковременная память).Я надеюсь закодировать музыку во многоформатный формат для обучения, то есть это будет 1, если эта нота играла, и 0, если эта нота не играла.Вот выдержка из того, как эти данные будут выглядеть:
0000000000000000000000000000000000000000000000000001000100100001000000000000000000000000
0000000000000000000000000000000000000000000000000001000100100001000000000000000000000000
0000000000000000000000000000000000000000000000000001000100100001000000000000000000000000
0000000000000000000000000000000000000000000000000001000100100001000000000000000000000000
0000000000000000000000000000000000000000000000000001000100100001000000000000000000000000
0000000000000000000000000000000000000000000000000011010100100001010000000000000000000000
Есть 88 столбцов, которые представляют 88 нот, и теперь каждый представляет новый удар.Вывод будет на уровне персонажа.
Мне просто интересно, так как в словаре только 2 символа, будет ли вероятность того, что 0 будет следующим всегда будет выше, чем вероятность1 быть следующим?Я знаю, что для большого словарного запаса нужен большой тренировочный набор, но у меня есть только маленький словарный запас.У меня есть 229 файлов, что соответствует примерно 50000 строк текста.Достаточно ли этого, чтобы вывод был равным 0?
Кроме того, было бы лучше иметь 88 узлов, по 1 для каждой ноты, или только один узел для одного символа за раз?
Заранее спасибо