PHP urlize функция - PullRequest
2 голосов
/ 26 мая 2010

Я использую эту функцию на своем веб-сайте для преобразования ввода пользователя в приемлемый URL-адрес:

function urlize($url) { 
$search = array('/[^a-z0-9]/', '/--+/', '/^-+/', '/-+$/' ); 
$replace = array( '-', '-', '', ''); 
return preg_replace($search, $replace, utf2ascii($url)); 
}     
function utf2ascii($string) { 
$iso88591  = "\\xE0\\xE1\\xE2\\xE3\\xE4\\xE5\\xE6\\xE7"; 
$iso88591 .= "\\xE8\\xE9\\xEA\\xEB\\xEC\\xED\\xEE\\xEF"; 
$iso88591 .= "\\xF0\\xF1\\xF2\\xF3\\xF4\\xF5\\xF6\\xF7"; 
$iso88591 .= "\\xF8\\xF9\\xFA\\xFB\\xFC\\xFD\\xFE\\xFF"; 
$ascii = "aaaaaaaceeeeiiiidnooooooouuuuyyy"; 
return strtr(mb_strtolower(utf8_decode($string), 'ISO-8859-1'),$iso88591,$ascii); 
}

У меня проблема с цифрами. Почему-то, когда я пытаюсь:

echo urlize("test 23342");

Я получаю "Test-Eiioe". Почему это так и как я могу это исправить?

Большое спасибо!

Ответы [ 5 ]

2 голосов
/ 26 мая 2010

Эй, похоже, вы пытаетесь создать слизняк. Если так, то это функция, которую я использую / предлагаю:

function slug( $string ) {
    return strtolower( preg_replace( array( '/[^-a-zA-Z0-9\s]/', '/[\s]/' ), array( '', '-' ), $string ) );
}
2 голосов
/ 26 мая 2010

Проблема в вашем utf2ascii. Я предлагаю вам использовать iconv() функцию вместо.

iconv("UTF-8", "ISO-8859-1//IGNORE", $string);

Часть // IGNORE в выходной кодировке означает игнорирование любого символа, который не может быть переведен. Плохая новость - вы теряете всех акцентированных персонажей. Чтобы сохранить их, вы можете использовать //TRANSLIT.

Затем вы можете использовать strtolower и некоторые регулярные выражения для исключения не алфавитно-цифровых символов (или для их замены на -).

Если вы хотите закодировать какие-либо данные, есть также urlencode(), но это не сделает вас хорошими ссылками.

1 голос
/ 26 мая 2010

Что не так с urlencode ()?

0 голосов
/ 21 декабря 2014

Я добавил замену акцентированного символа в ответе Максима Мишеля:

function urlize($url) {
    $search = array('/[^a-z0-9]/', '/--+/', '/^-+/', '/-+$/' );
    $replace = array( '-', '-', '', '');
    $unwanted_array = array(    'Š'=>'S', 'š'=>'s', 'Ž'=>'Z', 'ž'=>'z', 'À'=>'A', 'Á'=>'A', 'Â'=>'A', 'Ã'=>'A', 'Ä'=>'A', 'Å'=>'A', 'Æ'=>'A', 'Ç'=>'C', 'È'=>'E', 'É'=>'E',
                    'Ê'=>'E', 'Ë'=>'E', 'Ì'=>'I', 'Í'=>'I', 'Î'=>'I', 'Ï'=>'I', 'Ñ'=>'N', 'Ò'=>'O', 'Ó'=>'O', 'Ô'=>'O', 'Õ'=>'O', 'Ö'=>'O', 'Ø'=>'O', 'Ù'=>'U',
                    'Ú'=>'U', 'Û'=>'U', 'Ü'=>'U', 'Ý'=>'Y', 'Þ'=>'B', 'ß'=>'Ss', 'à'=>'a', 'á'=>'a', 'â'=>'a', 'ã'=>'a', 'ä'=>'a', 'å'=>'a', 'æ'=>'a', 'ç'=>'c',
                    'è'=>'e', 'é'=>'e', 'ê'=>'e', 'ë'=>'e', 'ì'=>'i', 'í'=>'i', 'î'=>'i', 'ï'=>'i', 'ð'=>'o', 'ñ'=>'n', 'ò'=>'o', 'ó'=>'o', 'ô'=>'o', 'õ'=>'o',
                    'ö'=>'o', 'ø'=>'o', 'ù'=>'u', 'ú'=>'u', 'û'=>'u', 'ý'=>'y', 'ý'=>'y', 'þ'=>'b', 'ÿ'=>'y' );
    $url = strtr( $url, $unwanted_array );
    $url = strtolower(iconv("UTF-8", "ISO-8859-1//TRANSLIT", $url));
    return preg_replace($search, $replace, $url);
}
0 голосов
/ 26 мая 2010

Ваша функция utf2ascii неправильная, именно она превращает test 23342 в test eiioe.

Почему бы вам не использовать iconv для преобразования UTF-8 в ISO-8859-1? то есть. используйте iconv("UTF-8", "ISO-8859-1//TRANSLIT", $url);

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...