Рута- нахождение аббревиатуры - PullRequest
1 голос
/ 13 июня 2019

Есть ли способ найти аббревиатуру незадолго до ее расширения, используя Uima Ruta.

Образец входного документа

Наука о данных »широко признана как все более мощная сила в области управления и разработки веб-сайтов, а также в обществе в целом. ML - это приложение искусственного интеллекта. Он обнаружил банкомат (ATM). , позволяющий этим компаниям постоянно внедрять инновации и улучшать пользовательский интерфейс с помощью быстрого приложения в любое время (ATM). Эти ATM последних двух компаний работают над восстановлением конкурентных преимуществ в развивающейся сети, используя методы обработки данных, включая обработку естественного языка (NLP) и машинное обучение (ML)

Задача

Я хочу получить значения, один ML не ATM Поскольку он используется в качестве краткой формы только после расширения. Есть ли способ сделать это?

1 Ответ

0 голосов
/ 03 июля 2019

Вот пример того, как проецировать аннотации, используя упрощенное определение определений.Помогает ли это?

PACKAGE uima.example;

DECLARE AbbreviationDefinition;
DECLARE AbbreviationLongform;
DECLARE Abbreviation;

STRINGLIST definedAccronyms;
INT expectedWordcount;

(W[expectedWordcount, expectedWordcount]{-> AbbreviationLongform} 
    SPECIAL.ct=="(" 
    c:@CAP{-> Abbreviation}<-{c{-> expectedWordcount = (c.end-c.begin)};} 
    SPECIAL.ct==")"
    ){-> AbbreviationDefinition};

// TODO check first characters of Abbreviation and AbbreviationLongform and remove annotations again if required

a:Abbreviation{PARTOF(AbbreviationDefinition) -> ADD(definedAccronyms, a.ct)};

MARKFAST(Abbreviation, definedAccronyms);


Abbreviation->{a:@Abbreviation{-> UNMARK(a)} ANY; ANY a:@Abbreviation{-> UNMARK(a)};};
a:Abbreviation{CONTAINS(Abbreviation,2,2) -> UNMARK(a)};

ОТКАЗ ОТ ОТВЕТСТВЕННОСТИ: Я разработчик UIMA Ruta

...