Как получить значение вероятности всех упоминаний сущности - PullRequest
0 голосов
/ 12 сентября 2018

Давайте рассмотрим этот текст:

"Джон Джозеф живет в Америке. Он работает в федеральном правительстве"

Я получаю следующеесущность упоминает для этого текста:

  1. John Joseph
  2. America
  3. He
  4. Federal government

Теперь я пытаюсь получить значение вероятности для каждой сущности, о которой упоминает.Когда я посмотрел на Java APIs, я заметил, что мы можем получить значение вероятности для каждого токена (Джон, Джозеф, Америка, Он, Федеральное правительство и правительство).

Но как мы можем получить значение вероятности "Джон Джозеф" и "Федеральное правительство" (более одного токена)?Есть ли какой-нибудь Java API для получения этого значения?

Любая помощь будет признательна.

1 Ответ

0 голосов
/ 13 сентября 2018

Мы собираемся добавить новую функцию в Stanford CoreNLP 3.9.2, которая присоединяет минимальную вероятность метки токена для объекта. Мы не будем предоставлять какой-либо оценки для чего-либо, полученного с помощью правил, потому что не ясно, какое доверие будет уместным. Так, например, «Джо Смит» может получить вероятность того, что жетон «Джо» имеет для ЛИЧНОСТИ. Это похоже на разумную эвристику.

Мы стремимся выпустить этот новый релиз до конца месяца! Я обновлю этот ответ с более подробной информацией после выпуска.

...