Я хочу знать, как обучить модель по моим собственным данным
Существует демоверсия voxceleb, которая использует публичные данные, вы можете запустить ее самостоятельно.
Вы также можете отформатировать данные в правильной структуре данных (создать файлы data / utt2spk и data / wav.scp) и работать с вашими данными.
https://github.com/kaldi-asr/kaldi/tree/master/egs/voxceleb/v2
и как использовать эту модель для фактической сегментации?
Вы начинаете со сценариев из демонстрации, удаляя неиспользуемые части.Это даст вам базовую демонстрацию сегментации.Вы можете вызвать эту сокращенную демонстрацию, чтобы выполнить сегментацию с помощью вызова system (2) из вашего приложения или аналогичным образом.
Затем, если вам нужно, вы можете превратить сценарии в соответствующие вызовы C ++ API и вызвать ту же процедуруиз C ++ или из любого языка сценариев.