Я работаю над базовым скриптом рута. Моя цель - определить скороговорку, скажем, сумму в валюте, но вернуть только ее числовое значение. Например, текст может быть «Я заплатил 54 доллара США за мою новую обувь». Я хочу идентифицировать «USD54», чтобы быть уверенным, что это денежная величина, а не количество, но я хочу получить только «54» из своего сценария, чтобы в своем последующем приложении я мог использовать его как число.
Весь мой сценарий как структура, подобная приведенной ниже, это нормально, но возвращает 54 доллара, а не только 54.
PACKAGE uima.ruta.example;
DECLARE VarA;
DECLARE VarB;
// 2 capital letters and any number of digits
// Example USD5 , USD6700
//
CAP{REGEXP("USD") -> MARK(VarA)}
NUM{ -> MARK(VarB),MARK(EntityType,1,2)};
Есть идеи, как решить эту проблему?
Приветствия.