Насколько я могу судить, он не включает частоты как таковые, хотя в возвращаемых результатах синтаксисы упорядочены от самых до наименее частых.
Вы можете получить фактические частоты несколькими способами. Возможно, наиболее надежным является использование корпуса с тегами POS, такого как Penn TreeBank, а затем просто вычислить значения самостоятельно. К сожалению, получить бесплатную копию этого сложно, если вы не в университете. Другой вариант - создать свой собственный корпус (возможно, из блогов, книг Project Gutenberg, Википедии и т. Д.), Запустить над ним POS-тегер, а затем вычислить частоты из этого. Очевидно, что этот метод будет искажен, но это намного проще, чем пометить корпус вручную.