Question

Я пытаюсь извлечь граф знаний из статей Википедии.Для извлечения необходимых троек я использую Stanford CoreNLP.К сожалению, качество добытых троек не соответствует ожиданиям.

Пример:

"Иоганн Карл Фридрих Гаусс был немецким математиком и физиком, внесшим значительный вклад во многие области математикии науки. Иногда его называют «математика Принцепса». Гаусс оказал исключительное влияние во многих областях математики и естественных наук ».

(physicist,make contribution to, many field)

Какие методы могут улучшить мой результат?Есть ли лучшие инструменты для извлечения троек из текста?

crypticbacon · Answer 1 · 18 апреля 2019

Вот одно решение, написанное на Java:

https://github.com/sunil3590/artificial-guy

Используется Stanford CoreNLP.Согласно методу main проекта , автор реализовал:

Разрешение совместной ссылки
Пометка части речи
NER tagging
Стебминг
Анализ зависимости

Построение графиков знаний с помощью Stanford CoreNLP

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Построение графиков знаний с помощью Stanford CoreNLP

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы