Есть ли хорошие ресурсы по семантическим технологиям?(RDF / OWL / GraphDB / Mining) - PullRequest
0 голосов
/ 04 июля 2019

Мне действительно интересны такие семантические технологии, как RDF / OWL / GrahpDB / Mining.Один случай использования, который особенно очаровывает меня, - это Edamam.Я наткнулся на этот веб-сайт и очень хотел бы узнать кое-что о технологиях, применяемых в этом проекте, применяя его сам в небольшом проекте, просто для учебных целей.Ссылка на их веб-сайт и соответствующую страницу: https://www.ontotext.com/knowledgehub/case-studies/edamam-mines-web-data/

Пожалуйста, позвольте мне процитировать кусок:

Edamam использовал смесь технологических решений Ontotext, ориентированных на веб-майнинг, анализ текста, онтологии, GraphDB и семантический поиск для решения проблемы.Технология веб-майнинга Ontotext сканирует сайты и извлекает рецепты.Edamam адаптировал сканеры, чтобы со временем охватывать все больше и больше сайтов.После того, как данные были идентифицированы, извлечены и классифицированы, была предоставлена ​​ссылка на исходный сайт и полный кредит.

Со временем онтология пищи Edamam (используемая для классификации всего) включала рецепты, ингредиенты, информацию о питании, меры, аллергии и многое другое.Основываясь на фактах, хранящихся в GraphDB, Edamam применил логические выводы для получения большего количества данных, включая время приготовления, диетические ограничения (например, веганский, вегетарианский, кошерный и т. Д.), Классификации рецептов, сложность рецептов, информацию о питании на порцию и степень, в которойРецепт способствует сбалансированному питанию.Более 30 различных классов информации и подробных атрибутов о рецепте являются частью базы знаний Edamam.

Раньше я читал о RDF и OWL раньше, но никогда не мог выделить времяв это из-за внешних факторов.Я бы очень хотел использовать эту возможность, чтобы узнать больше об этом!Однако в поисках знаний я сталкиваюсь с двумя проблемами:

  1. Кажется, я не могу найти хороших ресурсов.Мне или кажется, что источники, которые я нахожу, являются либо старыми (например, <2005) веб-сайтами, либо исследовательскими работами. </li>
  2. Последние страницы - это бизнес-страницы (наподобие той, на которую я ссылался), и хотя они дают представлениеИх недостаточно, чтобы учиться.
  3. Эти источники, которые я нахожу, не слишком углубляются (как онтология пиццы) и, похоже, не объединяют какие-либо другие технологии, такие как веб-майнинг.
  4. Кажется, я не могу найти активные сообщества, ориентированные на такие технологии, из которых я мог бы извлечь уроки.

Если у кого-то есть какие-то ресурсы, которые были бы полезны для вас и готовы делиться,Я был бы очень признателен за это !!

...