Я пишу стеммер Porter в xQuery и в качестве первого шага мне нужно сопоставить паттерны согласных и гласных.Согласующая последовательность соответствия из примера Perl, который я использую в качестве основы для этого, - (?:[^aiueoy]|(?:(?<=[aiueo])y)|\by)
, а последовательность гласных - (?:[aiueo]|(?:(?<![aiueo])y))
.Мне нужно расширить его, включив в него букву aesc (æ), и вот что я имею для своего регулярного выражения xquery:
let $v := element {"vowels"} {matches($f,"(?:([^aiueoy])|(?:(?:[aiueo]\1)y))")}
let $c := element {"consonants"} {matches($f,"(?:([aiueo])|(?:(?<![aiueo]\1)y))")}
Пример искомого типа XML выглядит следующим образом:
<entry ref="173">
<headword>abǒve</headword>
<headword>abǒven</headword>
<variant>abufe</variant>
<variant>abufen</variant>
<variant>abuue</variant>
<variant>abuuen</variant>
<variant>abowve</variant>
<variant>obove</variant>
<variant>oboven</variant>
<variant>obufe</variant>
<variant>obufen</variant>
<variant>abof</variant>
<variant>obof</variant>
<variant>aboyf</variant>
<variant>aboun</variant>
<variant>aboune</variant>
<variant>abown</variant>
<variant>abowne</variant>
<variant>aboon</variant>
<variant>oboun</variant>
<variant>oboune</variant>
<variant>abow</variant>
<variant>aboʒe</variant>
<part_of_speech> adv. </part_of_speech>
</entry>
При выполнении этого в Saxon, однако, я получаю следующую ошибку: Query failed with dynamic error: Syntax error at char 17 in regular expression: No expression before quantifier
Я почти уверен, что моя проблема в том, что я не правильно строю позитивный взгляд, изменив его с <=
до \1
, но я не уверен, как бы я построил этот аспект так, чтобы он работал с xQuery.Любые предложения будут высоко оценены.