Существует ли алгоритм генерации правил ассоциации из данных семантической сети (базы знаний) - PullRequest
0 голосов
/ 05 июля 2019

Я реализую подход для извлечения правил ассоциации из данных семантической сети.Я копирую работу Molood et al.(2017).Мне нужна помощь в алгоритме для генерации правил ассоциации из общего набора поведения (транзакций).например,

{Джон Леннон, Джордж Харрисон}: (инструмент, гитара) ==> (род занятий, SongWriter)

Подход SWARM, который я пытаюсь воспроизвести, имеет два модуля: 1. Предварительномодуль обработки (который содержит два подмодуля) a.Поколение семантических элементов б.Генерация набора общих поведений 2. И модуль майнинга, который содержит: Генерацию правил ассоциации.

Приведенный ниже примерный набор данных из набора данных DBpedia Ontology

Triple |Тема |Предикат |Объект

t1 |Джон Леннон |инструмент |Гитара т2 |Джордж Харрисон |инструмент |Гитара т3 |Билл Клинтон |офис |Президент США T4 |Джимми Картер |офис |Президент США t5 |Джон Леннон |род занятий |Автор песен t6 |Джордж Харрисон |род занятий |Автор песен t7 |Билл Клинтон |вечеринка |Демократическая т8 |Джимми Картер |вечеринка |Демократичный

Алгоритм генерации семантических элементов: ввод: тройной вывод: SI (семантический элемент)

  1. SI = NULL
  2. foundFlag = false
  3. длякаждый тройной тиджей в тройках делает
  4. pa_ = пару тдж
  5. для каждого si_ в СИ до
  6. , если pa_ = si.pa, тогда
  7. добавитьсубъект от tj до si.es;
  8. foudFlag = true;
  9. , если foundFlag = false, тогда
  10. новый семантический элемент si _;
  11. si_ = tj;
  12. добавить si_ в SI
  13. foundFlag = false;
  14. return SI

Алгоритм генерации семантических элементов принимает файл Triples в качестве входных данныхи выводить семантические элементы, такие как.------------------------------------- Семантические элементы -------------------------------------

si-1 {Джон Леннон, Джордж Харрисон} (инструмент, гитара)

si-2 {Джон Леннон, Джордж Харрисон} (род занятий, автор песен)

s1-3 {Джимми Картер, Билл Клинтон} (офис, президент США)

s1-4{Джимми Картер, Билл Клинтон} (партия, демократ)

Алгоритм набора общего поведения принимает семантические элементы и степень подобия в качестве наборов общего поведения ввода и вывода, таких как:


Наборы общего поведения

cbs-1 {Джон Леннон, Джордж Харрисон} (инструмент, гитара)

{Джон Леннон, Джордж Харрисон} (род занятий, автор песен)

cbs-2 {Джимми Картер, Билл Клинтон} (офис, президент США)

{Джимми Картер, Билл Клинтон} (партия, демократ)

Мне нужна помощь с эффективным алгоритмом, который будет принимать вобщие наборы поведений и минимальное значение поддержки для генерации правил ассоциации следующей формы


Правила ассоциации

r-1 {Джон Леннон, Джордж Харрисон}: (инструмент, гитара) ==> (род занятий, автор песен)

r-2 {Джимми Картер, БиллКлинтон}: (должность президента США) ==>

(партия демократическая)

...