Как узнать, имеют ли два слова одинаковую базу? - PullRequest
16 голосов
/ 13 января 2012

Я хочу знать, на нескольких языках, если два слова:

  • либо одно и то же слово,
  • или грамматические варианты одного и того же слова.

Например:

* * 1010 had и has имеют одинаковое основание: в обоих случаях это глагол have, city и cities имеют одинаковую базу. went и gone имеют одинаковую базу.

Есть ли способ использовать Microsoft Word API, чтобы не просто проверять орфографию текста, но и нормализовать слово в базе или, по крайней мере, определить, имеют ли два слова одну и ту же базу?

Если нет, то какие (бесплатные или платные) библиотеки (не веб-службы) позволяют мне это делать (опять же, на нескольких языках)?

Ответы [ 2 ]

2 голосов
/ 14 января 2012

Inflector.NET - это библиотека с открытым исходным кодом, которую вы можете использовать для нормализации перегиба английских существительных .Доступно по адресу: https://github.com/davidarkemp/Inflector/tree/master/Inflector

1 голос
/ 06 марта 2012

Snowball - это основополагающий API, который может работать с различными естественными языками, и есть реализации Snowball для различных языков программирования.

http://snowball.tartarus.org/

...