Кодовая база декодирования BeamSearch в возврате - PullRequest
0 голосов
/ 24 сентября 2018

В этом конфиге есть пример использования добавления lm_score с апостериором из модели ctc или seq2seq https://github.com/rwth-i6/returnn-experiments/blob/master/2018-asr-attention/librispeech/attention/exp3.ctc.lm.config

Я хотел бы знать, как он используется при декодировании с поиском луча.Я не могу найти пример декодирования BeamSearch?Указатель на тот код, который его реализует, будет полезен.

1 Ответ

0 голосов
/ 14 октября 2018

Конфигурация описывает модель и некоторые гиперпараметры для обучения и / или декодирования.

Фактический код для выполнения обучения и / или декодирования находится в самом Returnn.См. полная настройка как пример того, как вызвать Returnn для выполнения поиска луча.

В Returnn, очень кратко, поиск луча реализован с использованием чисто функций TF, поэтому он будет работать внутриграфик вычислений TF.При построении графика вычислений для модели есть search_flag, который говорит, что поиск должен быть выполнен.Существует ChoiceLayer, который расширит поисковый луч с помощью tf.topk в случае, если установлен search_flag.Настройка и выполнение графика вычислений происходит в TFEngine в функции search.

...