Это выглядит как пометка части речи и / или распознавание именованного объекта, НО, если вы обрабатываете английский язык, отдельные слова без контекста потенциально неоднозначны.Кроме того, отдельные слова не могут быть информативными.«новый» сам по себе может быть прилагательным (POS), но «Нью-Йорк» - это, скорее всего, место (NER).Посмотрите литературу по обеим задачам и рассмотрите возможность обработки как минимум функций уровня предложения.