Публикует ли spaCy данные разработки / тестирования для своего предварительно обученного парсера зависимостей (en_core_web_sm / md / lg), и если да, то где к ним можно получить доступ?
Для контекста: я пытаюсь измерить предварительно обученная точность синтаксического анализатора на конкретном типе предложения (а не только на всем древовидном банке, таком как Penn Treebank), и поэтому мне нужны помеченные золотом предложения из набора разработчиков или тестового набора, чтобы я мог определить тип предложения и оценить. Я бы использовал другой банк деревьев зависимостей, например банк деревьев универсальных зависимостей, но, к сожалению, схемы аннотаций немного отличаются.