Мы видели 4-байтовые символы UTF-8, хранящиеся в Oracle.Нам нужно определить, сколько строк имеют такие символы в определенном столбце.
Попробовал приведенную здесь рекомендацию - Дополнительные символы UTF-16 , но у меня это не сработало.Выдает ошибку - ORA-12728: недопустимый диапазон в регулярном выражении.Пробовал и другие ответы тоже.Ни один из них не работает.
Oracle задокументировал возможные диапазоны шестнадцатеричного кода для UTF-8 в таблице B-2 на этой странице Набор символов Unicode .Я пытаюсь обнаружить любой символ, который находится в строках 5 или 6 этой таблицы («Дополнительные символы: дополнительные символы китайского, японского и корейского языков; исторические символы; музыкальные символы; математические символы» ИЛИ «Область личного пользования № 2»)
Можно ли использовать регулярное выражение для обнаружения таких строк?
select count(*) from mytable where regexp_like(mycolumn, expression);