Продолжительность выпуска модели - PullRequest
0 голосов
/ 22 марта 2019

Я тренирую модель продолжительности телефона для системы синтеза речи, используя модель BLSTM с одним слоем из 2048 нейронов.Я даю последовательность телефонов модели и получаю длительность в миллисекундах для каждого телефона.Самое длинное предложение - 20 секунд (около 150 телефонов). Результат, который я получаю, странный.В начале предложения продолжительность короткая (скорость речи быстрая), и через 5 или 6 секунд речь становится все медленнее и медленнее.Данные в моем тренировочном наборе не содержат такой схемы.Я что-то пропустил?

...