Каковы алгоритмы ранжирования распознавания имен и какие лучше? - PullRequest
3 голосов
/ 09 мая 2011

Для инструментов NER (Name Entity Recognition), таких как DBpedia, Zemanta, OpenCalais, Alchemy и т. Д., Какие алгоритмы они используют и существует ли предпочтительный или распространенный алгоритм для использования?

Ответы [ 2 ]

2 голосов
/ 09 мая 2011

Последний раз я использовал двойной метафон , который использует эвристику, чтобы попытаться угадать исходный язык, которому принадлежит имя, и, следовательно, произношение, к которому оно должно привести.

В конечном счете, такое признание не работает так хорошо, как можно было бы ожидать. Большинство языков имеют правила транслитерации на латынь (также известные как латинизация для корейского языка), поэтому вы можете сначала проверить это.

2 голосов
/ 09 мая 2011

Проверка Soundex - очень хороший и известный алгоритм для сопоставления имен (как они звучат на английском языке).

...