Формат для использования для представления структурированных метаданных (dublin core, rdf, atom)? - PullRequest
1 голос
/ 18 марта 2011

Альтруистичным способом я хотел бы предоставить как можно больше структурированных данных о моем сайте. Я также не возражаю против повышения SEO, но это вторично.

Кажется, есть несколько вариантов:

  • Полный на RDF (убей меня сейчас XML)
  • Атом с вашими собственными пользовательскими тегами (нравится)
  • RDFa на вашей веб-странице (может помочь SEO)
  • Dublin Core Meta tags
  • Dublin Core с использованием RDFa
  • Атом с RDFa

Я просто пытаюсь облегчить людям получение данных с моего сайта.

Хорошая особенность стандартов в том, что их так много на выбор.

Как вы думаете, какой из них мне следует использовать?

Ответы [ 2 ]

4 голосов
/ 19 марта 2011

RDF - это не просто XML;RDF - это модель данных, которая опирается на наборы троек (субъект, предикат, объект) и URI для однозначной ссылки на вещи.На самом деле люди, работающие с RDF, стремятся убежать от RDF / XML, и мы предпочитаем RDF / Turtle или RDF / Ntriples , даже RDF в формате JSON.Эти сериализации более читабельны, их легче создавать и легче анализировать.Более того, существует множество инструментов, которые позволяют вам преобразовывать все ароматы RDF (например: рэппер или Jena ).

Когда дело доходит до публикации информациив RDF.Обычно у вас есть три варианта:

  1. Для предоставления дампов RDF ваших данных.
  2. Для публикации RDF в соответствии с Правилами связанных данных .
  3. Чтобы добавить метаданные к существующим веб-страницам с помощью RDFa.

... они не являются эксклюзивными.Вы можете выбрать любую комбинацию из них, наиболее важным является выбор правильной структуры URI (см. Классные URI не меняются ).

Следуя вашему профилю SO, я вижу, что выВы работаете над сайтом рекомендаций по вкусу в социальных сетях (http://evocatus.com/). Я предполагаю, что вы, возможно, захотите предоставить информацию об этих обзорах. Поэтому для обзора, подобного http://evocatus.com/sauce/cholula-chipolte-hot-sauce/272645/, вы можете предоставить различные сериализации и вернуть не только HTML, но и:

  • ... / Холула-чиполте-горячий соус / 272645 / rdf-turtle
  • ... / Холула-чиполте-горячий соус / 272645 / rdf-xml
  • ... / holula-chipolte-hot-sauce / 272645 / rdf-json
  • и один для любого другого типа формата, который вы хотите показать.

Кроме того, версия HTML может быть улучшена с помощью RDFa. В зависимости от типа клиента, который потребляет ваши данные, следуя правилам согласования содержимого, вы будете перенаправлять HTTP-запрос в любой формат, принятый клиентом.HTTP заголовок Accept. Итакзапрос, подобный приведенному ниже, с curl будет перенаправлен вашим приложением, возвращающим версию RDF / XML:

curl -H 'Accept: application/rdf+xml' .../holula-chipolte-hot-sauce/272645/

В будущем люди смогут говорить о существующих обзорах на вашем сайте.просто используя ваши URI в их данных RDF.В этом сила RDF и связанных данных.

О Dublin Core, вы можете использовать Dublin Core с RDF или RDFa.Но, в вашем случае, есть несколько других интересных онтологий, которые следует рассмотреть, и правильнее было бы использовать их все:

  • FOAF : Friend of a Friend,для выражения личной информации пользователя и отношений между пользователями.
  • Онтология тегов : Очень простая онтология для выражения информации тегов.
  • Словарь обзора RDF :Словарь для выражения отзывов и оценок с использованием RDF.
  • GoodRelations : онтология для выражения информации о продукте и электронной коммерции.
  • Vcard / RDF : для адресовОбычно используется в сочетании с FOAF.

Существует один сайт с именем http://revyu.com/, который использует все эти онтологии (кроме GoodRelations), поэтому вы можете использовать его в качестве руководства.См. Например:

... это версии HTML и RDF одного и того же обзора.

В отличие от ATOM, как вы можете видеть, с RDF вы сможете повторно использовать существующие онтологии, и поскольку RDF основан на URI, все будет взаимосвязано.

Значение добавленных связанных данных

Что бы произошло, если бы вы инвестировали когда-нибудь, связывая свои продукты и обзоры с другими источниками данных?(то есть: dbpedia.org или freebase.com).Давайте представим, что вы начнете связывать все свои обзоры пива (http://evocatus.com/beer/) с тем, на каком пивоваренном заводе производит продукт (http://dbpedia.org/page/Alcoholic_beverage),), перейдя по ссылкам, которые вы сможете узнать, например, о том, где производится предпочтительное пиво. Dbpedia хранит эту информацию.

Также обратите внимание, что в Freebase, которая также предоставляет версии RDF, вы можете ссылаться на производителей. Например, см. http://rdf.freebase.com/rdf/en.budweiser в RDF или http://www.freebase.com/view/en/budweiser в HTML.

2 голосов
/ 05 марта 2014

Dublin Core Schema - это небольшой набор словарных терминов, которые можно использовать для описания веб-ресурсов (видео, изображений, веб-страниц и т. Д.). Пример кода Dublin Core

 <meta name="DC.Format" content="video/mpeg; 10 minutes">

 <meta name="DC.Language" content="en" >

 <meta name="DC.Publisher" content="publisher-name" >

Ссылка для создания меток DC.Meta: http://www.dublincoregenerator.com/generator_nq.html

DC в мета-тегах для целей SEO - они устарели.

Было обнаружено, что использование элементов Dublin Core не улучшило поисковый рейтинг веб-страниц »и что« метаданные Dublin Core, как хорошо известная схема метаданных, не получили широкого распространения и не используются разработчиками поисковых систем и пауками ». не учитывайте его элементы при ранжировании веб-страниц.

Google НЕ использует это в своей индексации, и нет упоминания о ядре Дублина в Google или на сайте поисковой системы для индексации.

В Великобритании правительственные организации используют DC для обеспечения стандартизированного доступа к тегам.

Это не значит, что Google, Bing, Yahoo и т. Д. Никогда не будут их реализовывать. В наши дни Google использует больше метаданных и богатых фрагментов.

...