ищу какую-то существительную модель классификации - PullRequest
0 голосов
/ 10 мая 2018

все. В последнее время я думаю о том, как поместить слова в категорию или что-то в этом роде, когда изучаю НЛП. Например, если я попытаюсь научить компьютер понимать «яблоко», я также хочу, чтобы он понимал, что «яблоко» принадлежит «фрукту», так что он изучит это «фруктовое дерево» и поймет что-то вроде:

   fruit
     /\----
    /  \   \
apple  kiwi  pear

и это будет полезно, даже когда я хочу научить чему-то вроде: автомобили являются своего рода транспортным средством, поэтому некоторые другие виды транспорта включают: мотоциклы, самолеты и т. д.

Кто-нибудь знает, могу ли я найти какие-нибудь бумаги или демоверсии, работающие над этим видом? Спасибо.

Andes

Ответы [ 2 ]

0 голосов
/ 12 мая 2018

На самом деле, SKOS (Простая система организации знаний) хорошо подходит для этого. Это специализированный семантический язык, образованный от RDF.

Существует множество "больших" наборов данных, таких как Тезаурус ЮНЕСКО (EN / RU / FR / ES), Тезаурус BNF (FR), ... Это всего лишь пример среди многих других

Ссылка на документацию SKOS

0 голосов
/ 10 мая 2018

WordNet из Принстона включает некоторую классификационную информацию для существительных.Я бы порекомендовал формат базы данных RDF, который вы можете использовать для изучения того, какие отношения у него есть (а какие отсутствуют).

Например:

enter image description here

Хотя WordNet может сопоставлять значения друг с другом, с более сложной проблемой вы столкнетесь с тем, как вы определяете значениеслова в контексте в первую очередь.Например, "яблоко" это дерево или фрукт?

...