Использование регулярных выражений может быть не лучшим способом решения этой проблемы, но вот быстрое решение:
function link_keywords($str, $keyword, $url) {
$keyword = preg_quote($keyword, '/');
$url = htmlspecialchars($url);
// Use split the string on all <a> tags, keeping the matched delimiters:
$split_str = preg_split('#(<a\s.*?</a>)#i', $str, -1, PREG_SPLIT_DELIM_CAPTURE);
// loop through the results and process the sections between <a> tags
$result = '';
foreach ($split_str as $sub_str) {
if (preg_match('#^<a\s.*?</a>$#i', $sub_str)) {
$result .= $sub_str;
} else {
// split on all remaining tags
$split_sub_str = preg_split('/(<.+?>)/', $sub_str, -1, PREG_SPLIT_DELIM_CAPTURE);
foreach ($split_sub_str as $sub_sub_str) {
if (preg_match('/^<.+>$/', $sub_sub_str)) {
$result .= $sub_sub_str;
} else {
$result .= preg_replace('/'.$keyword.'/', '<a href="'.$url.'">$0</a>', $sub_sub_str);
}
}
}
}
return $result;
}
Общая идея - разбить строку на ссылки и все остальное. Затем разбейте все, что находится за пределами тега ссылки, на теги и простой текст и вставьте ссылки в обычный текст. Это предотвратит расширение [p class = "keyword"] до [p class = "[a href =" url "] keyword [/ a]"].
Опять же, я бы попытался найти более простое решение, не включающее регулярные выражения.