Есть немало информации для написания классификаторов. Я написал статью об этом в блоге некоторое время назад.
Что касается примеров / кода, то есть:
Ответ на другую часть вашего вопроса о том, говорит ли вам SDK, что такое каждое слово, ответ «нет», с несколькими «любопытными» предостережениями. В целом, базовые языковые модели не раскрываются, хотя вы можете делать что-то вроде получения информации о классификации из других классификаторов в надежде, что они предоставят вам достаточно информации; некоторые, такие как C #, дают много информации, которая может не отображаться в IDE в настройках шрифтов и цветов по умолчанию (проверьте настройки «Инструменты-> Параметры-> Среда-> Шрифты и цвета», чтобы узнать, хотите ли вы изменения уже могут быть), а другие, как VB, как правило, нет. Вы также можете использовать такие вещи, как CodeModel от DTE, но я никогда не слышал о том, чтобы кто-то имел действительно хороший опыт работы с ним.
Если вам нужен пример использования информации о классификации, вы можете увидеть, как это делает CommentTextTagger.cs (часть расширения проверки орфографии).