Есть два варианта, которые я могу придумать:
Первый вариант - перебирать образец POS-помеченных корпусов и просто создавать это отображение самостоятельно.Это дает вам POS-теги, которые связаны с определенным словом в корпусе.
Второй вариант - создать скрытый маркер POS-модели марков на корпусе, а затем проверить значения модели.Это дает вам POS-теги, которые связаны с определенным словом в корпусе, а также их априорные вероятности, а также некоторые другие статистические данные.
В зависимости от вашего варианта использования, один может быть лучше другого.Я бы начал с первого варианта, так как это быстро и просто.