Подготовка данных для системы i-vector / PLDA для распознавания говорящего - PullRequest
0 голосов
/ 04 декабря 2018

Я пытаюсь следовать этому руководству для обучения и оценки системы i-vector / PLDA с использованием набора инструментов SideKit для распознавания говорящего.

Система использует 4 подмножества данных: регистрация, тестирование, телевидение и плда.

Подмножество TV используется для вычисления общей матрицы изменчивости, которая затем используется для вычисления i-векторов из каждого из оставшихся подмножеств.

i-векторы plda используются для создания фильтров длярегистрация и тестирование i-векторов при оценке.

Кроме того, я предполагаю, что у меня есть некоторые фоновые сэмплы и сэмплы, которые я хочу зарегистрировать и впоследствии получить оценку.

Как определить содержаниеиз подмножеств тв и плда?Должны ли все подмножества быть независимыми (не перекрываться между собой)?

...