У меня есть вывод xmi из Tika UIMA Annotator, который передается в скрипт UIMA Ruta для дальнейшей обработки.Мне удалось успешно импортировать соответствующую систему типов и обнаружить любые MarkupAnnotations, охватывающие некоторый фрагмент текста.
Однако вход имеет некоторые MarkupAnnotations, которые имеют одинаковое значение для начала и конца (поэтому не охватывают никакой текст),Эти аннотации не распознаются механизмом RUTA.
Например, не запускается следующее правило:
MarkupAnnotation.name == "img" {-> MARK (IMAGE}};
однако в CAS Viewer я вижу множество заметок MarkupAnotes с именем функции, равным «img», и все они имеют одинаковые атрибуты начала и конца.
Должен ли я сделать некоторые дополнительные спецификации вскрипт для отлова таких аннотаций?