Я работаю над удалением знаков препинания из текстовой переменной, которая может быть фазовой, и т. Д. c.
Пример: Привет, я ламу Хуан! Hoy es día camión.
Код, который я использую:
REGEXP_REPLACE(text, '[^0-9A-Za-z ]+', '')
Обычно это работает хорошо. Проблема в том, что в некоторых языках мы имеем пунктуацию над некоторыми словами. Пример: día camión. При запуске приведенного выше кода, выход для этих слов "da" "camin". Он удаляет букву, связанную с пунктуацией.
Есть ли способ избежать этого?
Спасибо!