Использование wordnet (или некоторого простого словаря) для проверки того, является ли существительное исчисляемым или неисчисляемым из программы Java - PullRequest
7 голосов
/ 20 июня 2011

Я нашел 2 библиотеки на Java - JWNL и JAWS. До сих пор мне кажется, что эти API-интерфейсы хороши для поиска наборов и гипонимов и тому подобных вещей. Знаете ли вы, есть ли какой-нибудь инструмент для использования wordnet, чтобы проверить, является ли существительное исчисляемым / неисчисляемым существительным? Я имею в виду, люди используют Wordnet для этой задачи? Иначе, что это за инструмент?

Ответы [ 2 ]

1 голос
/ 29 ноября 2012

Если вы не можете найти простой источник, вы можете рассмотреть возможность создания собственного классификатора, т.е.написать свою собственную пользовательскую функцию.

Факторы, которые следует учитывать:

  • Есть некоторые английские словари, которые помечают существительные как (U) против (C) для неисчислимых и счетных,и вы могли бы где-нибудь узнать в Интернете.
  • Вы можете посмотреть на биграммы в огромном корпусе, чтобы увидеть, используется ли существительное в смысле исчисляемого или неисчисляемого: one boy или this boy или that boy, но some food или a little bit of food и т. Д.
  • Есть много угловых случаев, которые вы должны учитывать: I'd like some coffee против I'd like a coffee (сокращение от чашки кофе).Это становится сложным.

Этот вопрос SO очень актуален, хотя и не касается вашего запроса Java.Все три ответа на этот вопрос очень хорошие.

Надеюсь, это поможет.

0 голосов
/ 21 июня 2011

Я не на 100% уверен, что вы собираетесь, но WolframAlpha имеет интерфейс разработчика , который вы можете использовать.

Они такжепохоже, уже имеется java-библиотека , хотя бесплатная версия, по-видимому, ограничена 2k-запросами (не знаю, допустимо ли это ограничение).

...