получение семантически связанных ключевых слов для данного слова - PullRequest
0 голосов
/ 20 октября 2010

Существует ли какое-либо открытое / бесплатное программное обеспечение, которое дает вам семантически связанные ключевые слова для данного слова.например, слово «собака»: оно должно давать такие ключевые слова, как: животное, млекопитающее, ... или слово «Франция» должно давать вам такие ключевые слова, как: страна, Европа ....в основном набор ключевых слов, связанных с данным словом.

или, если его нет, кто-нибудь имеет представление о том, как это можно реализовать и насколько сложно это будет.*

Ответы [ 5 ]

1 голос
/ 27 октября 2010

Wordnet может быть то, что вам нужно.Wordnet группирует английские слова в наборы синонимов, предоставляет общие определения и записывает различные семантические отношения между этими группами.

Существует множество проектов, использующих Wordnet, здесь у вас есть список: http://wordnet.princeton.edu/wordnet/related-projects/

Посмотрите на это, вы можете найти его особенно полезным (http://kylescholz.com) http://kylescholz.com/projects/wordnet/?text=dog

вы можете увидеть живую демонстрацию здесь: http://kylescholz.com/projects/wordnet/?text=dog

Я надеюсь,это помогает.

0 голосов
/ 02 марта 2017

Если вы ищете онлайн-ресурсы, есть несколько вариантов для рассмотрения (по крайней мере, в 2017 году; ФП датируется 2010 годом).

Semantic Link (http://www.semantic -link.com ): создатель Semantic Link предлагает интерфейс для результатов вычисления метрики, называемой «взаимная информация», для пар слов по всем Английская Википедия. Доступны только слова, встречающиеся более 1000 раз в Википедии.

«Собака» достается вам, например: породистый, породы, клык, домашнее животное, щенки.

Кажется, однако, что вы действительно ищете онлайн-инструмент, который дает гипонимы и гиперонимы. Со страницы Википедии для «Гипонимия и гипернымость»:

В лингвистике гипоним (от греческого hupó, «under» и ónoma, «name») - это слово или фраза, семантическое поле которых включено в поле другого слова, его гипероним или гиперним (от греческого hupér, «over и ónoma, «имя»). Проще говоря, гипоним разделяет тип отношений с его гиперным. Например, голубь, ворона, орел и чайка - все это гипонимы птицы (их гипероним); что, в свою очередь, является гипонимом животного.

WordNet (https://wordnet.princeton.edu) обладает этой информацией и имеет инструмент онлайн-поиска. С помощью этого инструмента, если вы введете слово, вы получите одну или несколько записей с "S" рядом с ними. Если вы нажмете «S», вы можете просматривать «Синсетные (семантические) отношения» слова с этим значением или использованием, и это включает прямые гипер- и гипонимы. Это невероятно богато!

Например: «собака» (как в «домашней собаке») -> «клык» -> «плотоядное животное» -> «плацентарное млекопитающее» -> «позвоночное животное» -> «хордат» - > и т. д. или «собака» -> «домашнее животное» -> «животное» -> «организм» -> «живое существо» ->

Существует также WordNik, в котором перечислены гипернимки и обратные словарные слова (слова с данным словом в их определении). Гиперонимы для «Франция» включают «европейская страна / нация», а обратный словарь включает регионы и города во Франции, имена определенных правителей и т. Д. «Собака» получает гиперное «одомашненное животное» (и другие).

0 голосов
/ 20 октября 2010

Сапло имеет такую ​​поддержку. Хотя в Saplo API он еще не публично доступен, но теперь мы рассмотрим ваш вариант использования.

Фредрик Хёрте - Сапло

Обновление:

(Свяжитесь со мной через домашнюю страницу Saplo или @horte)

0 голосов
/ 21 октября 2010

Да.То, что вы ищете, является чем-то похожим на модель векторного пространства для поиска, и это лучший эффективный способ сделать.Существует несколько библиотек с открытым исходным кодом, доступных для скрытой семантической индексации / поиска (особый случай модели векторного пространства).Apache Lucene является одним из самых окулярных.Или что-то из Google код .

0 голосов
/ 20 октября 2010

Да. Компания Saplo в Швеции специализируется на этом. Я полагаю, что вы можете использовать их API для этого, и если вы спросите, вы можете использовать его бесплатно (если, конечно, не в коммерческих целях).

Saplo

...