Мне нужно удалить диакритические метки из строки, используя Perl 6. Я попытался сделать это:
my $hum = 'חוּם';
$ahm.subst(/<-[\c[HEBREW LETTER ALEF] .. \c[HEBREW LETTER TAV]]>/, '', :g);
Я пытаюсь удалить все символы, которые находятся за пределами диапазона между буквой иврита (א) и буквой иврита (ת). Я ожидал, что следующий код возвратит «חום», однако он возвращает «חם».
Полагаю, что по умолчанию Perl 6 работает с графемами, считает וּ одной графемой и удаляет все это. Часто разумно работать графами, но в моем случае мне нужно, чтобы он работал по кодам.
Я попытался найти наречие, которое бы работало по кодам, но не смогло его найти. Возможно, в Perl 6 также есть способ использовать свойства Unicode, чтобы исключить диакритические знаки, или включить только буквы, но я также не смог найти это.
Спасибо!