В Oracle 10g я хотел бы создать регулярное выражение для перечисления символов, которые
отличается между двумя строками.
Вот причина:
У меня есть таблица с полем, которое иногда содержит символы Unicode, которые не на французском языке.
Я могу перечислить строки, содержащие эти нестандартные символы, чтобы сделать будущее
очистка с помощью этого запроса:
SELECT DataID, Name, CONVERT(NAME, 'WE8ISO8859P1', 'WE8DEC')
FROM table
WHERE NAME <> CONVERT(NAME, 'WE8ISO8859P1', 'WE8DEC' )
где WE8ISO8859P1 - западноевропейский (что я принимаю)
и WE8DEC - 8-битные наборы символов от Digital Equipment Corporation (я знаю, что приложение поддерживает)
Я полагаю, что с помощью регулярного выражения Oracle я смог бы извлечь список всех этих нестандартных символов. Но я не знаком с regexp в Oracle, поэтому любая помощь будет оценена.
Вот моя (не работающая) идея:
select regexp_replace("éaé", '[a-z][A-Z]', '' ) from dual;
выдаст "é" как символ для очистки.