Я предлагаю использовать алгоритм машинного обучения. Вы можете использовать контролируемое обучение для обучения своей модели и иметь вероятность, если это имя или фамилия или даже лучше, если это человек. Я предлагаю Наивный алгоритм Байеса. Я рекомендую этот подход, потому что в моей работе у нас была эта проблема, и я решил с помощью машинного обучения.
Вы можете использовать эти наборы данных для обучения вашей модели с именами
https://mbejda.github.io/
и тогда у вас будет очень точная модель, чтобы определить, является ли слово именем человека.
Рекомендовать Python и библиотеку scki-learn.
Надеюсь, эта помощь.
Пожалуйста, спросите меня, есть ли у вас проблемы
С уважением.