Как найти родство в Wordnet с помощью Python - PullRequest
3 голосов
/ 07 сентября 2011

Я хотел бы найти сходство (не сходство) между двумя словами, использующими Python.Алгоритмы hso (Hirst and St-Onge, 1998), lesk (Banerjee and Pedersen, 2003) и vector (Patwardhan, 2003) реализованы в Perl здесь , но я не могу найти то же самое для Pythonв nltk lib.

мне нужно использовать Python, так как он является частью более крупного командного проекта на Python.Любые ведет ?? 1005 *

Ответы [ 3 ]

4 голосов
/ 13 сентября 2011

Существует также веб-интерфейс, к которому вы можете получить доступ - вы можете написать клиент Python для запроса веб-интерфейса для получения значений lesk или vector.

Вы можете найти эти веб-интерфейсы здесь ...

http://marimba.d.umn.edu http://talisker.d.umn.edu

Удачи, Тед

4 голосов
/ 27 сентября 2011

Я использовал NLTK для загрузки WordNet в графическую базу данных Neo4j (см. https://groups.google.com/d/topic/gremlin-users/C1OlTG9xCpo/discussion).

И я использовал Bulbs (http://bulbflow.com/) для создания библиотеки под названием WordGraph для взаимодействия с Neo4j / WordNet через REST-сервер Rexster (https://github.com/tinkerpop/rexster/wiki/).

Bulbs - это библиотека Python, которая позволяет использовать язык программирования графов Gremlin (https://github.com/tinkerpop/gremlin/wiki) для запроса / обхода Neo4j, а в данном случае, в частности, WordNet.

Я в процессе публикации WordGraph на Github (https://github.com/espeed/wordgraph) - напишите мне, если у вас есть вопросы.

2 голосов
/ 07 сентября 2011

Если у вас уже есть реализации perl, почему бы просто не написать оболочку Python, которая вызывает код perl?Таким образом, ваш проект на Python может использовать функциональность, и вам не нужно переписывать реальные алгоритмы.В nltk уже есть много вещей, которые работают именно так.

...