Я пытаюсь настроить function
для фильтрации на веб-странице наиболее часто используемых слов.
Теперь я могу получить HTML веб-сайт, и функция считает слова, фильтрует их по наиболее используемым, но не может заставить работать слова, которые меньше 3 символов, не будут отображаться.
$contents = file_get_contents('https://www.basketnews.lt');
$search = array(
'@<script[^>]*?>.*?</script>@si', // Strip out javascript
'@<head>.*?</head>@siU', // Lose the head section
'@<style[^>]*?>.*?</style>@siU', // Strip style tags properly
'@<![\s\S]*?--[ \t\n\r]*>@', // Strip multi-line comments including CDATA
);
$contents = preg_replace($search, '', $contents);
$result = array_count_values(
str_word_count(strip_tags($contents), 1)
);
arsort($result);
print_r($result);
Как реализовать дополнительные функции для этой функции?