Если вы хотите использовать символы латинского акцентирования (например, à Ñ) как обычные буквы (т.е. избегать их совпадения), вам также необходимо включить соответствующий диапазон Unicode ( \ u00C0- \ u00FF *)1002 *) в вашем регулярном выражении, поэтому это будет выглядеть так:
/[^a-zA-Z\d\s:\u00C0-\u00FF]/g
^
отрицает то, что следует a-zA-Z
соответствует заглавным и строчным буквам \d
соответствует цифрам \s
соответствует пробелу (если вы хотите использовать только пробелы, замените его пробелом) :
соответствует двоеточию \u00C0-\u00FF
соответствует диапазону Unicode для латинских символов с ударениями.
nb.Сопоставление с диапазоном Юникода может не работать для всех движков регулярных выражений, но вышеописанное, безусловно, работает в Javascript (как видно из этого пера на Codepen).
nb2.Если вас не беспокоит сопоставление подчеркивания, вы можете заменить a-zA-Z\d
на \w
, что соответствует буквам, цифрам и подчеркиванию.