Английские базы лемматизаторов? - PullRequest
4 голосов
/ 10 июня 2011

Знаете ли вы достаточно большую базу данных лемматизатора, которая возвращает правильный результат для следующих примеров слов:

geese: goose
plantes: //not found

Недостаточно морфологического анализатора Wordnet, поскольку он дает следующие неверные результаты:

geese: //not found
plantes: plant

Ответы [ 2 ]

2 голосов
/ 10 июня 2011

MorphAdorner , кажется, лучше в этом, но он все еще находит неправильный результат для "plantes"

plantes: plante
geese: goose

Возможно, вы хотели бы использовать MorphAdorner для выполнения лемматизации,а затем проверить его результаты по WordNet.Вы можете использовать API WordNet для выполнения поиска без первого выполнения лемматизации путем вызова findtheinfo_ds.Это позволяет вам сначала использовать лемматизатор, такой как MorphAdorner.(Если вы хотите использовать леммайзер, вам нужно будет позвонить morph отдельно и позвонить findtheinfo_ds на леммах, которые он вернул.)

С другой стороны, я потратил всего 5 секунд на поискв MorphAdorner для этой цели, и может быть способ устранить неправильный ответ «plantes» без использования какого-либо другого внешнего ресурса.

1 голос
/ 10 июня 2011

Однажды , кто-то предложил мне Морфа , но я не использовал его, поэтому я не знаю, будет ли это лучше, чем WordNet.

...