Поскольку ОП была открыта для любого коммерчески доступного предложения ...
«IBM InfoSphere Global Name Analytics» представляется коммерческим решением, удовлетворяющим первоначальному запросу на разбор [неструктурированного] личного имени [полное имя]; очевидно, с определенной степенью уверенности в отношении решения некоторых проблем двусмысленности имен, на которые ссылаются другие ответы.
Примечание: у меня нет личного опыта или связи с продуктом, я просто столкнулся с этим обсуждением и следующими ссылочными ссылками, пока провести повторное расследование по той же проблеме, что и описанная ФП. НТН.
Ссылка на общую документацию по продукту:
http://publib.boulder.ibm.com/infocenter/gnrgna/v4r1m0/topic/com.ibm.gnr.gna.ic.doc/topics/gnr_gna_con_gnaoverview.html
См. «Разбор имен с использованием NameParser» по адресу
.
http://publib.boulder.ibm.com/infocenter/gnrgna/v4r1m0/topic/com.ibm.gnr.gna.ic.doc/topics/gnr_np_con_parsingnamesusingnameparser.html
NameParser - это API-интерфейс компонента для продукта на
http://publib.boulder.ibm.com/infocenter/gnrgna/v4r1m0/topic/com.ibm.gnr.gna.ic.doc/topics/gnr_gnm_con_logicalarchitecturecapis.html
См. "Разбор имен с использованием IBM NameWorks" в
http://publib.boulder.ibm.com/infocenter/gnrgna/v4r1m0/topic/com.ibm.gnr.gna.ic.doc/topics/gnr_gnm_con_parsingnamesusingnameworks.html
«IBM NameWorks объединяет отдельные компоненты IBM InfoSphere Global Name Recognition в единый, унифицированный, простой в использовании интерфейс прикладного программирования (API), а также расширяет эту функциональность для приложений Java и в качестве веб-службы»
http://publib.boulder.ibm.com/infocenter/gnrgna/v4r1m0/topic/com.ibm.gnr.gna.ic.doc/topics/gnr_gnm_con_logicalarchitecturenwapis.html
Чтобы прояснить, почему я думаю, что это отвечает на вопрос, смягчая некоторые из ранее упомянутых трудностей в выполнении задачи ... Если я правильно понял прочитанное, API используют "сервер NameHunter" для поиска в "IBM InfoSphere Global Архив данных об именах (NDA) », который описывается как« коллекция из почти одного миллиарда имен со всего мира, а также пол и страна ассоциации для каждого имени. Этот большой репозиторий информации об именах поддерживает алгоритмы и правила, которые IBM InfoSphere Global Продукты для распознавания имен используются для классификации, классификации, анализа, сопоставления и сопоставления имен. "
FWiW Я также наткнулся на «анализатор имен», который использует базу данных с ~ 140K именами, как указано в:
http://www.melissadata.com/dqt/websmart-web-services.htm