У меня есть набор данных с короткими мелодиями, напеваемыми подопытными. Каждая мелодия состоит из переменного количества нот (от 10 до 20 нот) и кодируется уровнями высоты звука нот (автоматически извлекаемых из аудиофайла), а также с точки зрения контура основного тона (как код Парсонса *) 1002 *, например "* udduududuudu").
Для каждой пары или мелодий я хотел бы вычислить числовую меру сходства контуров, которая составляет (я думаю) поиск подходящей меры сходства строк между соответствующими кодами Парсона.
Сначала я использовал простое расстояние редактирования (в частности, эта реализация ), однако я не уверен, что это достаточно "надежно", учитывая шумную природу автоматически извлекаемых уровней высоты тона мелодий.
Кто-нибудь может посоветовать, подходит ли расстояние редактирования (реализация, которую я использовал для этого) в качестве меры сходства строк, или может быть более подходящей другая мера?