Сегментация динамиков с использованием подхода x-вектора Калди - PullRequest
0 голосов
/ 23 мая 2018

Я использую kaldi для asr, и теперь я хочу сделать сегментацию динамиков, используя подход x-вектора Калди.Они предоставляют некоторые примеры сценариев сегментации в https://github.com/kaldi-asr/kaldi/tree/master/egs/sre16/v2. Они также предоставляют базовую предварительно обученную модель для корпуса НРС в https://david -ryan-snyder.github.io / 2017/10/04 / model_sre16_v2.html

Эта предварительно обученная модель при разархивировании имеет следующую структуру:

enter image description here

У меня нет доступа к корпусу НРС и IХотите знать, как обучить модель на моих собственных данных, а затем, как использовать эту модель для реальной сегментации?

1 Ответ

0 голосов
/ 24 мая 2018

Я хочу знать, как обучить модель по моим собственным данным

Существует демоверсия voxceleb, которая использует публичные данные, вы можете запустить ее самостоятельно.

Вы также можете отформатировать данные в правильной структуре данных (создать файлы data / utt2spk и data / wav.scp) и работать с вашими данными.

https://github.com/kaldi-asr/kaldi/tree/master/egs/voxceleb/v2

и как использовать эту модель для фактической сегментации?

Вы начинаете со сценариев из демонстрации, удаляя неиспользуемые части.Это даст вам базовую демонстрацию сегментации.Вы можете вызвать эту сокращенную демонстрацию, чтобы выполнить сегментацию с помощью вызова system (2) из ​​вашего приложения или аналогичным образом.

Затем, если вам нужно, вы можете превратить сценарии в соответствующие вызовы C ++ API и вызвать ту же процедуруиз C ++ или из любого языка сценариев.

...