Как отобразить субъективные данные в семантической сети? - PullRequest
4 голосов
/ 15 июня 2009

Я искал проект freebase для хранения данных. Кажется, это отличное место для хранения конкретных, объективных данных, таких как имена, места и даты. Это хорошее место для хранения субъективных данных, таких как мнения или оценки? Существуют ли другие / лучше открытые данные, хранилище семантических данных или стратегия для хранения и запроса информации такого типа?

Кроме того, поскольку это субъективно, я могу быть уверен, что другие не согласятся с моим мнением. Как я могу хранить мнения других, чтобы мнение зрителей могло быть представлено лучше?

Является ли freebase подходящим местом для хранения данных такого типа?

Например: рейтинг ресторана или рейтинг фильма. Рейтинг фильма, вероятно, будет менее чувствительным ко времени, чем рейтинг ресторана. Любая неидентифицирующая информация о человеке, который ввел данные, будет интересна для определения других факторов и отношений.

Ответы [ 4 ]

2 голосов
/ 16 июня 2009

Семантическая сеть - это более или менее вариант логики первого порядка, по большей части, поэтому важной частью является четкое понимание того, что «означает» каждый из ваших предикатов. Эта идея очень проста, но применима к широкому спектру смысловых представлений, т. Е. Она лежит в основе сущностной модели баз данных.

Не должно быть проблем с представлением информации, которую вы упомянули в семантическом веб-представлении. Просто убедитесь, что у вас есть четкое определение того, что обозначает каждый из ваших предикатов, чтобы значение не изменялось со временем, и в результате вы получили непоследовательное представление.

Книга Джинезерета старая, но хорошая, если вы хотите прочитать об этом более подробно. Я думаю, что многие люди, которые работали в Семантической паутине, были вовлечены в проект Cyc Дугласа Лената, который постепенно со временем перешел на логическое представление значений.

http://www.amazon.com/Logical-Foundations-Artificial-Intelligence-Genesereth/dp/0934613311

Сайт для Cyc:

http://www.cyc.com/

1 голос
/ 15 июня 2009

Я считаю, что проектирование / выбор форматов данных очень сложно без понимания вопросов, которые я буду задавать, используя эти данные. С какой целью вы ожидаете, что данные будут использоваться для? Придумайте варианты использования, которые могут помочь при поиске.

Хранение атрибутивных данных - это открытая тема для исследований, в ходе которой разрабатывается (в том числе) среди разведывательного сообщества: этим пользователям, очевидно, необходимо отслеживать, откуда взялась информация и кто ее добавил по пути, как для проверки его надежность и делать такие вещи, как отслеживать, была ли секретная информация была включена случайно. Это может быть хорошим местом для поиска.

0 голосов
/ 15 июня 2009

Данные - это данные, которые вы хотите пометить, как данные, как они есть, мнение или рейтинг. Я полагаю, что «факт», который можно сделать из таких данных, заключается в том, что большинство людей имеют x субъективное мнение по данной теме.

...