Преобразование голоса, как преобразование цветного изображения в оттенки серого? - PullRequest
0 голосов
/ 16 мая 2011

этот вопрос без категории .. я думаю. Интересно, можно ли преобразовать каждый записанный голос в один стандартный голос, чтобы иметь возможность работать с ним?

Позвольте мне объяснить на изображении. У меня есть цветное изображение, но я знаю, что очень трудно распознать букву. Итак, давайте преобразовать это. Теперь я могу работать с изображением в оттенках серого. У меня больше способностей, чтобы работать над этим тогда.

Несколько дней я закончил свой собственный алгоритм распознавания букв на картинке, поэтому у меня есть некоторый опыт. :]

Можете ли вы дать мне несколько хороших идей или алгоритмов преобразования голоса в голос, над которыми я могу легко работать?

edit1

Допустим, два человека разговаривают с микрофоном моего компьютера. Смотри, что график моего голоса и голос моего друга различны. Я спрашиваю, есть ли возможность нормализовать оба голоса до одного универсального голоса. Если я запрограммирую «Привет!», Это не сработает, если моя подруга скажет «Привет!» В моей программе (написано на c #).

1 Ответ

0 голосов
/ 16 мая 2011

На основании вашего обновления я думаю, что вы ищете комбинацию программного обеспечения для распознавания голоса и синтеза речи.Я предлагаю посмотреть на CMUSphinx: http://cmusphinx.sourceforge.net/ и фестиваль: http://festvox.org/ соответственно.

Поэтому используйте распознавание голоса, чтобы определить, что люди говорят, и выводить как стандартный «голос», используя синтез речи.

...