$html=strip_tags($html);
$html=ereg_replace("[^A-Za-zäÄÜüÖö]"," ",$html);
$words = preg_split("/[\s,]+/", $html);
Разве это не заменяет все символы (не A-Z, a-z, a o u с умлаутами) пробелом?
Я теряю такие слова, как zugänglich и т. Д. С умлаутами
Что-то не так с регулярным выражением?
редактирование:
Я заменил ereg_replace на preg_replace, но почему-то специальные символы, такие как:, ®, не заменяются пробелом ...