Есть два возможных решения в зависимости от того, что эти сущности в реальной жизни.
Если это объекты типа hex hex и \u0026
на самом деле представляет собой символ &
, который отображается в консоли как \u0026
, вам, вероятно, не нужно предпринимать никаких действий, поскольку все в порядке, как есть.
Если это буквальные подстроки, которые вы хотите удалить из текста, вы можете использовать
REGEXP_REPLACE( input, '\\s*\\\\U\\d{4}', '' )
См. эту демонстрацию регулярных выражений и график регулярных выражений :
Подробнее
\s*
- 0+ пробелов
\\
- обратный слеш
U
- U
char
\d{4}
- четыре цифры.
Обратите внимание, что внутри строкового литерала каждый обратный слэш должен быть экранирован дважды, так как \
используется в строках для формирования escape-последовательностей строк, таких как \n
(новая строка), \t
(табуляция) и т. Д. См. Побег персонажей и предостережения .