Рассмотрим следующий скрипт, содержащий запутанные адреса электронной почты, и функцию, которая пытается заменить их на *****
с помощью сопоставления с регулярным выражением.Мой сценарий пытается перехватить слова: "at", "a t", "a.t", "@"
, за которым следует некоторый текст (любое доменное имя), затем "dot" "." "d.o.t"
, за которым следует TLD.
Ввод:
$str[] = 'dsfatasdfasdf asd dsfasdf dsfdsf@hotmail.com';
$str[] = 'I live at school where My address is dsfdsf@hotmail.com';
$str[] = 'I live at school. My address is dsfdsf@hotmail.com';
$str[] = 'at school my address is dsfdsf@hotmail.com';
$str[] = 'dsf a t asdfasdf asd dsfasdf dsfdsf@hotmail.com';
$str[] = 'd s f d s f a t h o t m a i l . c o m';
function clean_text($text){
$pattern = '/(\ba[ \.\-_]*t\b|@)[ \.\-_]*(.+)[ \.\-_]*(d[ \.\-_]*o[ \.\-_]*t|\.)[ \.\-_]*(c[ \.\-_]*o[ \.\-_]*m|n[ \.\-_]*e[ \.\-_]*t|o[ \.\-_]*r[ \.\-_]*g|([a-z][ \.\-_]*){2,3}[a-z]?)/iU';
return preg_replace($pattern, '***', $text);
}
foreach($str as $email){
echo clean_text($email);
}
Ожидаемый результат:
dsfatasdfasdf asd dsfasdf dsfdsf***
I live at school where My address is dsfdsf@***
I live at school. My address is dsfdsf@***
***
dsf ***
d s f d s f ***
Результат:
dsfatasdfasdf asd dsfasdf dsfdsf***
I live ***
I live ***
at school my address is dsfdsf****
dsf ***
d s f d s f ***
Проблема: Это ловитпервое вхождение «at», а не последнее, поэтому происходит следующее:
input: 'at school my address is dsfdsf@hotmail.com'
produces: '****'
should produce: 'at school my address is dsfdsf****'
Как это исправить?