В 2006 статье о временной классификации Классификации, Alex Graves & co. представил модель декодирования речи с метками 27 : 26 для букв алфавита и одна для пробел , что означает отсутствие метки (что, как я понимаю, silence ).
Однако я вижу много реализаций CTC, в которых используются метки 28 , одна из которых blank , а другая - space . До сих пор я не смог найти объяснения необходимости использовать оба этих ярлыка, и для меня они представляют одно и то же.
Не могли бы вы объяснить разницу между пробелом и пробелом в контексте CTC и почему нужны оба этих ярлыка?