основная частота женского голоса - PullRequest
0 голосов
/ 15 декабря 2018

Согласно тому, что я прочитал в Интернете, нормальный диапазон основной частоты женского голоса составляет от 165 до 255 Гц.Я использую Praat, а также библиотеку Python Parselmouth, чтобы получить основные значения частоты женского голоса в аудиофайле (.wav).Тем не менее, я получил некоторые значения, которые превышают 255 Гц (например: 400 + Гц, 500 Гц).Нормально ли получать такие большие значения?

1 Ответ

0 голосов
/ 15 декабря 2018

Это возможно, но маловероятно, если вы пытаетесь уловить основную частоту (F0) говорящего голоса.Вероятно, вместо этого вы захватываете более легко резонирующий обертон (например, F1 или F2).

Мои эксперименты с Praat создают у меня впечатление, что при хороших параметрах он надежно извлекает F0.

То, что вы хотите сделать, это проверить это, сравнив кривую основного тона со спектрограммой.Вот пример фитинга, изготовленного Praat (женский динамик):

Spectrogram and F0

Из изображения видно, что

  • Наиболее заметная частота, по-видимому, F2
  • Около 200 Гц, по-видимому, равна F0, так как ниже этого уровня есть только шум (по сравнению с до / после сегмента)
  • Praat рассчитал хорошую оценкуF0 для сегментов вокализованной речи

Если после визуального осмотра кажется, что вы получаете неправильные результаты, вы можете попытаться настроить параметры.Длина окна сильно влияет на разрешение по частоте.

Если вы не можете зафиксировать частоты на столь низких частотах, попробуйте увеличить длину окна - интуиция заключается в том, что он дает алгоритму больше шансов найти медленно меняющиеся периодические элементы в данных.

...