Идентификация голоса как мужчины или женщины - PullRequest
2 голосов
/ 17 июня 2010

Я не сильно разбираюсь в звуковой инженерии, поэтому, пожалуйста, будьте осторожны со мной.Я получаю аудиофайл в качестве входного сигнала, и мне необходимо определить, является ли динамик мужчиной или женщиной.Есть идеи, как это сделать?

Я использую php, но я открыт для использования других языков, и не прочь немного поучиться теории звука, пока время пропорционально задаче.

Ответы [ 4 ]

6 голосов
/ 17 июня 2010

Я не могу дать конкретное представление об этой проблеме, но начну с прочтения следующей статьи: Половая классификация из речи .

Это должно, по крайней мере, дать представление о концепциях / методологиях (в этой статье, насколько я могу судить, это описывается достаточно хорошо).

3 голосов
/ 18 июня 2010

Прежде всего вам нужно будет найти значения высоты тона, и в этой статье можно найти один отличный алгоритм для нахождения значений высоты звука для голоса: http://www.fon.hum.uva.nl/paul/papers/Proceedings_1993.pdf.

Это удивительно точно.

2 голосов
/ 17 июня 2010

Я с Кристофом, и в этом у меня не слишком много опыта с этим, а также я думаю, что некоторые исследования будут вашим лучшим путем.

Если бы мне пришлось сделать попытку, я бы предположил, что это потребует вычисления частотного спектра выборки с использованием преобразований Фурье, а затем выяснения, где находится средняя частота. Создайте большую выборку мужчин и женщин для разных культур и языков, а затем сравните среднюю частоту вашей конкретной выборки с установленными средними показателями для мужчин и женщин.

Хотя я могу быть совершенно неправ, поэтому исследование - действительно ваш лучший выбор.

1 голос
/ 17 июня 2010

Одним из подходов будет использование искусственных нейронных сетей. Вы предоставляете нейронной сети несколько примеров для обучения, и она, надо надеяться, научится правильно классифицировать голоса. Вам, вероятно, придется выполнить извлечение некоторых объектов с использованием преобразований Фурье, чтобы получить данные в подходящей форме.

Существует несколько статей об этом подходе, если вы ищете в Google «идентификацию говорящего по нейронной сети», но, к сожалению, я недостаточно знаком с ними, чтобы рекомендовать какой-то конкретный.

...