В общем, нет способа сделать это.Баум-Уэлч найдет классы использования слов, которые имеют схожие распределения, но нет особой причины предполагать, что эти классы будут отображаться каким-либо прямым способом в категории, заданные любой конкретной лингвистической теорией.Поэтому неконтролируемые POS-теги в основном полезны для приложений, в которых вам важны классы эквивалентности слов или фраз, а не конкретные назначаемые теги.
Если вам действительно нужны читаемые человеком ярлыки (например, во время разработки, чтобы оценить, насколько достижимы результаты, даже отдаленно правдоподобные), я бы поставил несколько десятков предложений.Затем вы можете применить свой производный от BW тегер к этому помеченному мини-корпусу, чтобы вызвать сопоставление между номерами классов и надписями POS.