Определить основную частоту записи голоса - PullRequest
1 голос
/ 24 мая 2019

Я использую инструмент командной строки aubiopitch для анализа голосовых записей.Моя цель - определить основную частоту записанного голоса.Я знаю, конечно, что частота меняется - поэтому я хочу вычислить «среднее» в Гц за 30-секундную запись.

Мой вопрос: aubio использует разные методы для определения высоты записи: Триггер Шмитта, гармонический гребень, инь, иньффт и т. Д. Какой из них будет моим предпочтительным выбором при работе с чисто человеческими записями голоса (без фоновой музыки, атмо и т. Д.).

Ответы [ 2 ]

2 голосов
/ 27 мая 2019

Я бы порекомендовал использовать yinfast или yinfft (default). Для обсуждения алгоритмов, их параметров и их производительности, см. Глава 3 этого документа .

Обратите внимание, что медиана в этом случае подходит лучше, чем в среднем.

0 голосов
/ 25 мая 2019

CREPE хорош и превосходит многие другие, поскольку он использует передовое машинное обучение нейронной сети для прогнозирования основного тона. Однако он может быть нестабильным в невиданных условиях и не всегда может быть легко подключен, поскольку требует тензорного потока.

Для более традиционного и легкого решения можно попробовать REAPER .

...