Я пытаюсь следовать этому руководству для обучения и оценки системы i-vector / PLDA с использованием набора инструментов SideKit для распознавания говорящего.
Система использует 4 подмножества данных: регистрация, тестирование, телевидение и плда.
Подмножество TV используется для вычисления общей матрицы изменчивости, которая затем используется для вычисления i-векторов из каждого из оставшихся подмножеств.
i-векторы plda используются для создания фильтров длярегистрация и тестирование i-векторов при оценке.
Кроме того, я предполагаю, что у меня есть некоторые фоновые сэмплы и сэмплы, которые я хочу зарегистрировать и впоследствии получить оценку.
Как определить содержаниеиз подмножеств тв и плда?Должны ли все подмножества быть независимыми (не перекрываться между собой)?