Компенсация эффектов канала - PullRequest
1 голос
/ 04 июля 2011

Я пытаюсь работать в системе, в которой качество записанного предложения оценивается компьютером. Эта система работает в трех режимах:

  1. Когда человек записывает предложение с использованием микрофона и микшера.
  2. Когда пользователь записывается через стационарный телефон.
  3. Когда пользователь записывает по мобильному телефону.

Я замечаю, что оценки, которые я получаю из записей с использованием вышеуказанных 3 источников, имеют следующий порядок: Mic_score> Landline_score> mobile_score

Вполне вероятно, что приведенный выше порядок обусловлен влиянием кодеков и характеристик канала. Мой вопрос:

  1. Что можно сделать, чтобы компенсировать артефакты, введенные в канал / кодек, для получения согласованных оценок по каналам? Если какая-то обратная фильтрация, то, пожалуйста, предоставьте несколько ссылок, с которых я мог бы начать.
  2. Как определить, на каком канале была записана входная речь? Использовать HMM?

Edit 1: Я не вправе вдаваться в детали критериев. Текущие оценки, которые я получаю от микрофона, стационарного телефона и мобильного телефона (для одного и того же сказанного предложения (и одинаково произносятся в трех средах), примерно 80, 66, 41. Эта разница может быть из-за эффектов канала. Если контент и способ выражения предложения тот же, тогда я ищу алгоритм, который normalizes баллов (они не обязательно должны быть одинаковыми, но они должны быть близки).

Ответы [ 2 ]

2 голосов
/ 04 июля 2011

Стационарный кодек удалит все частоты около 4 кГц и выше.Кодек сотового телефона выбрасывает больше информации как часть процесса сжатия с потерями.Если у вас нет другого побочного канала информации о исходном аудиоконтенте, не существует надежного способа восстановить выброшенное аудио.

Лучше всего нормализовать, чтобы выполнить фильтрацию низких частот в соответствии с 8Кодек Telco для кГц и прогон результата через некоторый алгоритм сжатия сотовой связи (может быть опубликован для вашего конкретного мобильного сотового протокола).Это должно снизить качество всех 3 сигналов примерно до одинакового.

2 голосов
/ 04 июля 2011

Вполне может быть, что качество звука другое.Вы пробовали слушать некоторые примеры?

Вы также можете использовать любой анализатор спектра, чтобы детально рассмотреть эти данные.Я предлагаю http://www.baudline.com/. На что вам следует обратить внимание: Расстояние между уровнем шума и речью.

Также обратите внимание на высокочастотные шумовые всплески, когда произносятся буквы t, f и s.В линиях низкого качества разница между этими буквами исчезает.

Почему вы хотите исказить показатели качества?Давать объективный ответ качества, кажется, имеет больше смысла.

...