С такой моделью, как en_core_web_lg
, которая включает тегер и правила для лемматизатора на основе правил, она предоставляет леммы на основе правил, а не леммы поиска, когда POS-теги доступны для использования с правилами. Леммы поиска в целом невелики и используются только в качестве резервной копии, если модель / конвейер не имеет достаточно информации для предоставления основанных на правилах лемм.
При faster
тег POS равен ADV
, который оставлен как есть по правилам. Если бы он был помечен как ADJ
, лемма была бы fast
с текущими правилами.
Лемматизатор пытается предоставить лучшие леммы, которые он может, не требуя от пользователя каких-либо настроек, но он также не очень настраиваемый прямо сейчас (v2.2). Если вы хотите запустить теггер, но у вас есть леммы поиска, вам придется заменить леммы после запуска теггера.