Мне нужно отфильтровать строку, когда я создаю XML для электронных счетов для Италии.
От конкретных принимаются только:
String1000LatinType
"[\p{IsBasicLatin}\p{IsLatin-1Supplement}]{1,1000}"
Я не в курсе диапазона, но ядумаю:
a-z
, A-Z
, 0-9
, с акцентом как: à ò ù è é ì
, ç
и такими символами, как: , . _ - : ; '
и пробелом
Я бы хотелисключить все остальные символы непосредственно с клавиатуры, например: "£$%&/()=?^°§*+\|/<>
и tab
Я пытался конвертировать с помощью этой функции, но я не гуру с регулярным выражением:
function sanitize($tag) {
$newtag = preg_replace ("/[\p{Latin}A-Z0-9a-z\-\_\.\,\:\;' ]/", "", $tag);
return $newtag;
}
$tag = "Qwerty 12345 £$%&/()=?^ èéòàùì +*°ç.,-_<>\/l'èok .,;:";
var_dump(sanitize($tag));
Может кто-нибудь помочья?
Я хотел бы получить:
Qwerty 12345 èéòàùì ç.,-_l'èok .,;: