Используя spaCy
возможно ли иметь контекстное состояние как расширение токена?Представьте себе предложение типа.
Now I am talking about cities and that is my current state. But now I talk about countries and then that is my state.
Для токенов Now I am talking about
состояние неизвестно, в то время как из cities and that is my current state. But now I talk about
состояние CITY
, а остальное - COUNTRY
.Не берите в голову плохой пример.
Теперь я мог бы получить что-то вроде
Token.set_extension('state', default=None)
и затем изменить атрибут для всех оставшихся токенов в Doc
, когда я совпаду с cities
иcountries
, но это будет сильно тормозить, что вызывает беспокойство.
Есть ли у spaCy
более разумный способ реализовать такую логику?