Как конкретно отформатировать метки в pytorch 1.0 для использования CTCLoss .
Способ, который описан в оригинальной статье, состоит в том, чтобы иметь один дополнительный пустой класс + класс токенов при выполнении классификации по символам, поэтому, если моя исходная метка - «CAAT», а индекс - C: 1, A: 2, T: 3
для нормальной кросс-энтропийной потери метка была бы [1,2, 2,3]
, какой она должна быть для потери CTC, будет ли метка делатьесли я просто слепо добавляю пустой токен после каждого токена в оригинальной метке:
To Predict per char -> "CAAT"
Карта токенов -> blank: 0 C: 1,A: 2, T: 3
метка -> [1,0, 2,0, 2,0, 3, 0]
это правильно?
Также для использования упоминаний CUDNN Pytorch нужно быть в «сцепленной форме»
Как так?в каком измерении?и какова будет длина цели в этом случае?