Набор тегов Hebrew Stanford NLP - PullRequest
       88

Набор тегов Hebrew Stanford NLP

0 голосов
/ 08 октября 2019

Я пытаюсь найти список точных наборов тегов, используемых в древнееврейском банке деревьев, используемых Stanford NLP. Найти этот набор тегов кажется труднее, чем найти POS-тегер:)

Существуют ли какие-либо инструменты для чтения набора тегов, используемого для обучения банка (Penn?) Деревьев?

1 Ответ

1 голос
/ 09 октября 2019

Для пакета python stanfordnlp для всех языков используется набор POS-тегов Универсальный набор зависимостей (UD) v2 . Некоторые корпуса UD также включают в себя оригинальный набор POS-тегов, который часто более детализирован. Но хотя древнееврейский древовидный банк изначально создавался с собственным набором POS-тегов, а затем был добавлен в UD, похоже, что поставляемая версия в хранилище UD поставляется только с набором UD-тегов. Отдельные языки могут использовать только подмножество набора тегов UD POS. Вы можете найти подробности об этом на странице Treebank Hub для TreeBank . Там вы увидите, что используются 15 из 17 POS-тегов UD.

...