Единственный очевидный способ - иметь словарь правильных известных имен и хорошую индексацию для быстрого поиска, если такая вещь существует.
Но у меня такое ощущение, что вы ищете способ грамматически сделать вывод, что слово является существительным.
Я не могу придумать идеального способа сделать это, но если вы создали ряд правил, вы могли бы использовать их для разбора отрывка.
Правила могут включать.
* Слова, оканчивающиеся на ly, не являются собственными
* Шумовые слова, такие как и, к, но и т. Д. Не являются собственными существительными
* слова с заглавными буквами, но не начинающие предложение, являются собственными существительными
Чтобы улучшить его, вы можете использовать эти правила для создания словаря имен собственных. Каждый раз, когда слово следует одному из этих правил, оно либо добавляется, либо удаляется из правильного словаря существительных.
Это очень грубо - если это на правильном пути, то, вероятно, я могу быть более конкретным.