Если мне нужно использовать предварительно обученные векторы слов в качестве слоя внедрения в нейронных сетях (например, скажем, CNN), как мне работать с индексом 0?
Подробно:
Обычно мы начинаем с создания массива 2D с нулевым смещением.Позже мы заполняем индексы слов из словаря.Проблема в том, что 0 уже является индексом другого слова в нашем словаре (скажем, «i» - это индекс в 0).Следовательно, мы в основном инициализируем всю матрицу, заполненную «i» вместо пустых слов.Итак, как мы справляемся с заполнением всех предложений одинаковой длины?
Одно простое всплывающее сообщение: мы можем использовать другую цифру = numberOfWordsInVocab + 1 для заполнения.Но разве это не займет больше?[Помоги мне!]