Построение графиков знаний с помощью Stanford CoreNLP - PullRequest
0 голосов
/ 21 октября 2018

Я пытаюсь извлечь граф знаний из статей Википедии.Для извлечения необходимых троек я использую Stanford CoreNLP.К сожалению, качество добытых троек не соответствует ожиданиям.

Пример:

"Иоганн Карл Фридрих Гаусс был немецким математиком и физиком, внесшим значительный вклад во многие области математикии науки. Иногда его называют «математика Принцепса». Гаусс оказал исключительное влияние во многих областях математики и естественных наук ».

(physicist,make contribution to, many field)

Какие методы могут улучшить мой результат?Есть ли лучшие инструменты для извлечения троек из текста?

1 Ответ

0 голосов
/ 18 апреля 2019

Вот одно решение, написанное на Java:

https://github.com/sunil3590/artificial-guy

Используется Stanford CoreNLP.Согласно методу main проекта , автор реализовал:

  • Разрешение совместной ссылки
  • Пометка части речи
  • NER tagging
  • Стебминг
  • Анализ зависимости
...