Используя пакет dtw для Python, я могу анализировать только небольшое подмножество из 5-se c. клип аудио - как я могу проанализировать весь клип? - PullRequest
0 голосов
/ 23 февраля 2020

В Python 3, выполняя код в записной книжке Jupyter из пакета dtw (https://dynamictimewarping.github.io/python/), я обнаружил, что могу анализировать только подмножество 5-se c. клип аудио. Я пытаюсь сопоставить два клипа аудио, говорящих примерно одно и то же. Когда я выбираю первые 40 000 точек (из 130 000) массива Numpy, я получаю разумный результат, то есть он работает, но когда я пытаюсь использовать полный массив, ядро ​​всегда падает. Я что-то упускаю или у кого-то был подобный опыт? Вот как выглядит код, если это помогает (после того, как были установлены соответствующие пакеты и импортированы библиотеки):

aligning = dtw(Spoken_Ramz, Sung_Ramz, keep_internals=True)

dtw(Spoken_Ramz, Sung_Ramz, keep_internals=True, 
step_pattern=rabinerJuangStepPattern(6, "c"))\
.plot(type="twoway",offset=-2)

wq = warp(aligning, index_reference=False)

plt.plot(Sung_Ramz);
plt.plot(Spoken_Ramz[wq]);
plt.gca().set_title("Warping Spoken_Ramz")

И снова сокращенный раздел массива Numpy работает, поэтому выравнивание Spoken_Ramz [1000: 40000 ] с Sung_Ramz [1000: 40000] в порядке и дает ожидаемые результаты:

Dtw двух временных рядов

Заранее спасибо! :)

...