Я работаю над исследованием распознавания коиц, я преобразовал набор голосовых данных в LSF (частота спектральных линий) путем декодирования файла, закодированного amr-wb (G722.2), я создаю набор данных с файлами из 16 векторов ISF / LSF в каждом кадре.
я использовал python код, хорошо работающий для функций MF CC для того же набора данных в формате wav; но с набором данных, преобразованным в векторы LSf, я получил сообщение, когда мы начинаем отслеживать и подгонять модель GMMmmm.
сообщение об ошибке:
base.py ", строка 469, в _do_forward_pass return logsumexp (fwdlattice [-1]), fwdlattice
IndexError: индекс -1 выходит за пределы оси 0 с размером 0