Зависит от того, что вы подразумеваете под «идиомой».Предложение Джо о маркировке POS, вероятно, является хорошим началом - и может быть тем, что вы действительно ищете.Если это так, прочитайте «Обработка естественного языка с Python» Bird et al.Он опубликован O'Reilly, но также доступен онлайн по лицензии Creative Commons.Это поможет вам начать с маркировки POS.Там также есть хороший обзор способностей НЛТК.Например, можно ли адаптировать некоторые методы «Распознавания именованных объектов», чтобы делать то, что вы хотите?Или, возможно, то, что вы хотите, просто слишком сложно.Я подозреваю, что последний случай (как подразумевается Рафи), но вы узнаете об этом в своем путешествии.Возможно, вы разработаете что-то новое во время своего путешествия, и в этом случае я надеюсь, что вы вернете сообществу NLTK.