Нужны ли дополнительные настройки в скрипте RUTA для обнаружения аннотаций с одинаковыми атрибутами начала и конца? - PullRequest
0 голосов
/ 23 сентября 2018

У меня есть вывод xmi из Tika UIMA Annotator, который передается в скрипт UIMA Ruta для дальнейшей обработки.Мне удалось успешно импортировать соответствующую систему типов и обнаружить любые MarkupAnnotations, охватывающие некоторый фрагмент текста.

Однако вход имеет некоторые MarkupAnnotations, которые имеют одинаковое значение для начала и конца (поэтому не охватывают никакой текст),Эти аннотации не распознаются механизмом RUTA.

Например, не запускается следующее правило:

MarkupAnnotation.name == "img" {-> MARK (IMAGE}};

однако в CAS Viewer я вижу множество заметок MarkupAnotes с именем функции, равным «img», и все они имеют одинаковые атрибуты начала и конца.

Должен ли я сделать некоторые дополнительные спецификации вскрипт для отлова таких аннотаций?

1 Ответ

0 голосов
/ 30 ноября 2018

Соответствие аннотации длиной 0 (начало == конец) не поддерживается UIMA Ruta (2.6.1).

Существуют различные причины, например, последовательное сопоставление проблематично, так как аннотацияможет предшествовать и следовать за собой.

ОТКАЗ ОТ ОТВЕТСТВЕННОСТИ: Я разработчик UIMA Ruta

...