В последнее время я недостаточно использовал NLTK, но если у вас есть слова, которые, как вы знаете, являются навыками, вам не нужно делать NER - просто текстовый поиск.
Возможно, используйте Lucene или какой-либо другой поискбиблиотека, чтобы найти текст, а затем аннотировать его?Это много работы, но если вы работаете с большим количеством данных, это может быть хорошо.В качестве альтернативы вы можете объединить поиск регулярных выражений, который будет медленнее, но, вероятно, будет работать нормально для небольших объемов данных и будет намного проще в реализации.