Используйте Spacy Models, чтобы найти модальный глагол для языков fr, es, ru - PullRequest
0 голосов
/ 13 января 2020

Я использую модели Spacy для поиска модального глагола (MD) на следующих языках:

en
de
fr
es
ru

Из tag_map.py из en и de ясно, что "VerbType": "mod" является модальным глаголом. Но tag_map.py для fr , es и ru такого свойства не имеют. Как я могу найти модальный глагол в этих 3 языках (на каких свойствах я должен сосредоточиться)? Также есть ли какой-нибудь общий способ c, чтобы я мог найти модальный глагол любого языка, выпущенного Spacy в будущем, скажем, греческий выпущен?

Примечание: я не ищу высокоуровневые теги, но Я ищу теги низкого уровня. В терминологии Spacy я предпочитаю token.tag_ свойство.

1 Ответ

1 голос
/ 13 января 2020

Я не думаю, что в настоящее время существует независимый от языка способ сделать это. Но модальные слова - это слова с закрытым классом, поэтому просто проверяйте, если token.tag_ == 'AUX' (хотя в немецком языке модальные глаголы помечены как VERB), и если token.lemma_ входит в набор модальных глаголов, следует выполнить эту работу.

...