Как получить полный список POS, Tag и Dep в spaCy? - PullRequest
0 голосов
/ 03 октября 2019

Значения POS, TAG и DEP, используемые в spaCy, являются общими для NLP, но я полагаю, что существуют некоторые различия в зависимости от базы данных корпуса.

Например, Универсальные участники зависимостей перечислило 37 синтаксических зависимостей. Использует ли spaCy все эти 37 зависимостей? И ничего более?

Есть ли команда для вывода всех значений POS, TAG и DEP, которые может предоставить spaCy?

Ответы [ 2 ]

2 голосов
/ 03 октября 2019

Определенный компонент конвейера может отображать свои метки:

nlp = spacy.load('en')
nlp.get_pipe("tagger").labels
# ('$', "''", ',', '-LRB-', '-RRB-', '.', ':', 'ADD', 'AFX', 'CC', 'CD', 'DT', 'EX', 'FW', 'HYPH', 'IN', 'JJ', 'JJR', 'JJS', 'LS', 'MD', 'NFP', 'NN', 'NNP', 'NNPS', 'NNS', 'PDT', 'POS', 'PRP', 'PRP$', 'RB', 'RBR', 'RBS', 'RP', 'SYM', 'TO', 'UH', 'VB', 'VBD', 'VBG', 'VBN', 'VBP', 'VBZ', 'WDT', 'WP', 'WP$', 'WRB', 'XX', '_SP', '``')

spacy.explain(label) даст краткое определение для большинства меток, например:

spacy.explain("NN")
# 'noun, singular or mass'
spacy.explain("PERSON")
# 'People, including fictional'

Подробная документация находится здесь:https://spacy.io/api/annotation

1 голос
/ 04 ноября 2019

Вы можете использовать эту ссылку для dep_ list

https://github.com/clir/clearnlp-guidelines/blob/master/md/specifications/dependency_labels.md

...