найти корень слова - PullRequest
       12

найти корень слова

5 голосов
/ 27 марта 2011

Мне нужно построить словарь php, который найдет слово корня слова. Ex. поиск "автомобили", он скажет "Автомобили во множественном числе автомобилей" Или «взял», это «прошедшее время принятия»

Я рассматриваю возможность использования Wordnet, но это кажется сложным.

Есть предложения? м отчаялся

С уважением,

Ответы [ 3 ]

5 голосов
/ 28 марта 2011

Ну, так как предложенный стеммер не работает для вас корректно, вы можете выбрать тот, который вам больше подходит, здесь:

http://snowball.tartarus.org/

Здесь также есть интересная библиотека: http://sourceforge.net/projects/nlp/

Также ссылки на аналогичные вопросы по StackOverflow:

Инструменты программирования НЛП с использованием PHP?

Анализ текста с помощью PHP

UPDATE: Как мне использовать слово "Стемминг" или "Лемматизация"?

http://www.reddit.com/r/programming/comments/8e5d3/how_do_i_programatically_do_stemming_eg_eating_to/

http://www.nltk.org/

Wordnet лемматизатор: http://wordnet.princeton.edu/wordnet/download/

1 голос
/ 27 марта 2011

Что ж, вот расширение, которое используется для обозначения слов (я полагаю, что это то, что вам нужно): http://pecl.php.net/package/stem

Однако он не выполняет грамматического анализа работы.

Вот версия только для php: http://www.chuggnutt.com/stemmer.php

0 голосов
/ 17 апреля 2015

Вы можете попробовать бесплатный API Lemmatizer здесь: http://twinword.com/lemmatizer.php

Прокрутите вниз, чтобы найти конечную точку лемматизатора.

Это позволит вам переводить «собак» в «собаку», «способностей» в «способности».

Если вы передадите параметр POST или GET, называемый «текст», со строкой, подобной «пройденным растениям»:

// These code snippets use an open-source library. http://unirest.io/php
$response = Unirest\Request::post("[ENDPOINT URL]",
  array(
    "X-Mashape-Key" => "[API KEY]",
    "Content-Type" => "application/x-www-form-urlencoded",
    "Accept" => "application/json"
  ),
  array(
    "text" => "walked plants"
  )
);

Вы получите ответ, подобный этому:

{
  "lemma": {
    "plant": 1,
    "walk": 1
  },
  "result_code": "200",
  "result_msg": "Success"
}
...