Regex: Как исключить символы шрифтов в сети? - PullRequest
0 голосов
/ 06 мая 2010

В моей форме есть свободное текстовое поле, где пользователи могут вводить что угодно. Некоторые пользователи вставляют текст в это поле из документов Word с некоторыми странными символами, которые я не хочу добавлять в свою БД. (например, веб-символы шрифта) Я пытаюсь получить регулярное выражение, которое дало бы мне только буквы и знаки препинания. Но когда я попробую следующее, на выходе останутся все символы. Как я могу их пропустить?

<html><body><script type="text/javascript">var str="";document.write(str.replace(/[^a-zA-Z 0-9 [:punct]]+/g, " "));</script></body></html>

1 Ответ

1 голос
/ 06 мая 2010

Если вы хотите только ascii, используйте /[^ -~]+/ в качестве регулярного выражения. Проблема в вашем [:punct:] утверждении. Возможно, javascript не поддерживает [:punct:]?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...