Я не думаю, что использование pcre regex необходимо ... если это действительно разбивает слова, которые вам нужны.
Вы можете сделать что-то вроде этого и в тесте посмотреть, будет ли он быстрее / лучше ...
$splitby = array('these','are','the','words','to','split','by');
$text = 'This is the string which needs to be split by the above words.';
$split = explode(' ', $text);
$result = array();
$temp = array();
foreach ($split as $s) {
if (in_array($s, $splitby)) {
if (sizeof($temp) > 0) {
$result[] = implode(' ', $temp);
$temp = array();
}
} else {
$temp[] = $s;
}
}
if (sizeof($temp) > 0) {
$result[] = implode(' ', $temp);
}
var_dump($result);
/* output
array(4) {
[0]=>
string(7) "This is"
[1]=>
string(18) "string which needs"
[2]=>
string(2) "be"
[3]=>
string(5) "above words."
}
Единственная разница с вашим выводом - последнее слово, потому что "слова".! = "слово", и это не разделенное слово.