Привет всем участникам сообщества,
Изучив различные статьи и блоги, я понял, что в корпусе (C1
) предположим, что существует слово (w
). Теперь это же слово (w
) также появляется в другом связанном корпусе (C2
). Точно так же существует n
количество слов в корпусе.
Под инъекцией слова я понимаю следующее: - слово (w
) в корпусе (C1) заменяется его измененной версией (.w
) с присвоением некоторого специального символа как (.
, _
или $
) в корпусе (C2.
).
Примечание: Модифицированная версия слова (.w
) не относится к корпусам C1 и C2. Слово .w
- это то же слово, что и w
, используемое в другом контексте.
Это правильное объяснение для инъекции слова в НЛП?
Например, слово system
заменяется на _system
.
Надеюсь, это правильное определение инъекции слова. Существует ли в Python какой-либо способ достичь вышеупомянутой концепции?
Любая помощь приветствуется.