Question

Я пытаюсь работать в системе, в которой качество записанного предложения оценивается компьютером. Эта система работает в трех режимах:

Когда человек записывает предложение с использованием микрофона и микшера.
Когда пользователь записывается через стационарный телефон.
Когда пользователь записывает по мобильному телефону.

Я замечаю, что оценки, которые я получаю из записей с использованием вышеуказанных 3 источников, имеют следующий порядок: Mic_score> Landline_score> mobile_score

Вполне вероятно, что приведенный выше порядок обусловлен влиянием кодеков и характеристик канала. Мой вопрос:

Что можно сделать, чтобы компенсировать артефакты, введенные в канал / кодек, для получения согласованных оценок по каналам? Если какая-то обратная фильтрация, то, пожалуйста, предоставьте несколько ссылок, с которых я мог бы начать.
Как определить, на каком канале была записана входная речь? Использовать HMM?

Edit 1: Я не вправе вдаваться в детали критериев. Текущие оценки, которые я получаю от микрофона, стационарного телефона и мобильного телефона (для одного и того же сказанного предложения (и одинаково произносятся в трех средах), примерно 80, 66, 41. Эта разница может быть из-за эффектов канала. Если контент и способ выражения предложения тот же, тогда я ищу алгоритм, который normalizes баллов (они не обязательно должны быть одинаковыми, но они должны быть близки).

hotpaw2 · Answer 1 · 04 июля 2011

Стационарный кодек удалит все частоты около 4 кГц и выше.Кодек сотового телефона выбрасывает больше информации как часть процесса сжатия с потерями.Если у вас нет другого побочного канала информации о исходном аудиоконтенте, не существует надежного способа восстановить выброшенное аудио.

Лучше всего нормализовать, чтобы выполнить фильтрацию низких частот в соответствии с 8Кодек Telco для кГц и прогон результата через некоторый алгоритм сжатия сотовой связи (может быть опубликован для вашего конкретного мобильного сотового протокола).Это должно снизить качество всех 3 сигналов примерно до одинакового.

whoplisp · Answer 2 · 04 июля 2011

Вполне может быть, что качество звука другое.Вы пробовали слушать некоторые примеры?

Вы также можете использовать любой анализатор спектра, чтобы детально рассмотреть эти данные.Я предлагаю http://www.baudline.com/. На что вам следует обратить внимание: Расстояние между уровнем шума и речью.

Также обратите внимание на высокочастотные шумовые всплески, когда произносятся буквы t, f и s.В линиях низкого качества разница между этими буквами исчезает.

Почему вы хотите исказить показатели качества?Давать объективный ответ качества, кажется, имеет больше смысла.

Компенсация эффектов канала

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 2 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Компенсация эффектов канала

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 2 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы